Die Bochumer Firma G-Data hat die Sprachausgabetechnologie LOGOX4 entwickelt. Die Qualität der Sprachausgabe sei bei gleichzeitiger Verkleinerung des Speicherbedarfs stark verbessert worden. Mit der in das Programm Webspeech 4 integrierten Technik könne der Computer nicht nur beliebige Texte vorlesen, sondern erstmalig auch singen und sogar in Dialekten sprechen, so der Hersteller. Die neue Version von Webspeech 4 mit vier Sprecher-Stimmen steht ab sofort kostenlos zum Download zur Verfügung.
„Mit der LOGOX4-Technologie sind wir einen entscheidenden Schritt in der Kommunikation zwischen Maschine und Mensch vorangekommen. Unsere von Grund auf neu entwickelte Technologie ermöglicht den Einzug der Sprache in das tägliche Leben mit elektronischen Geräten. PCs und PDAs sind da erst der Anfang“, konstatierte G-Data-Vorstand Fridolin Rummel.
Die neuartige Sprachtechnologie beruht auf der selbst entwickelten Mikrosegmentsynthese, die es ermöglicht, aus nur 380 Lautbausteinen (Mikrosegmenten) jedes Wort einer Sprache verständlich und menschlich darzustellen. LOGOX4 habe laut den Entwicklern mit der Vorgänger-Version LOGOX3 außer dem grundlegenden Verfahren nichts mehr gemeinsam.
Entscheidend für die Qualitätssteigerung der neuen Sprachtechnologie seien die flexible Systemarchitektur, die verbesserte Textanalyse sowie die neu konzipierte Signalverarbeitung. Für eine verfeinerte Sprachqualität soll die intelligente Transformation von Text in Ton-Signale sorgen. Sie ermöglicht durch Satzanalysen eine „deutlich menschlichere“ Sprechmelodie und einen variableren Sprecherrhythmus.
Zudem könne der Anwender Sprechgeschwindigkeit, Tonhöhe sowie Intonation nach seinen Vorlieben einstellen. Die neue Architektur mit der einhergehenden Flexibilität ermöglichen sogar echte Weltneuheiten: Mit LOGOX4 kann der Computer nun sogar singen oder in Dialekten sprechen.
Die neue LOGOX4-Engine wurde in plattformunabhängigem Code entwickelt. Umsetzungen sind für Windows und Windows CE vorhanden. Das Programm soll nur 1,5 MByte Speicherplatz mit einer Stimme benötigen. LOGOX4 hat damit das Potential, neben dem Einsatz in Organizern mittelfristig als auch Technologie für Sprachchips in Mobiltelefonen, Navigationssystemen, elektronischen Spielzeugen und auch in Haushaltsgeräten zum Einsatz zu kommen, so G-Data.
Als Mindestvoraussetzungen für ein System nennt der Hersteller einen PC mit 200 MHz, 16 MByte RAM, Win 9x/ ME/ 2000/ XP sowie Internet Explorer ab Version 4.0. Empfohlen wird ein Pentium III mit 64 MByte RAM und Internet Explorer Version 5.0.
Kontakt:
G Data, Tel.: 0234/97620 (günstigsten Tarif anzeigen)
OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.
Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…
Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…
Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.
Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…
Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…