Categories: Software

Neue Sprachtechnologie kann Dialekte sprechen

Die Bochumer Firma G-Data hat die Sprachausgabetechnologie LOGOX4 entwickelt. Die Qualität der Sprachausgabe sei bei gleichzeitiger Verkleinerung des Speicherbedarfs stark verbessert worden. Mit der in das Programm Webspeech 4 integrierten Technik könne der Computer nicht nur beliebige Texte vorlesen, sondern erstmalig auch singen und sogar in Dialekten sprechen, so der Hersteller. Die neue Version von Webspeech 4 mit vier Sprecher-Stimmen steht ab sofort kostenlos zum Download zur Verfügung.

„Mit der LOGOX4-Technologie sind wir einen entscheidenden Schritt in der Kommunikation zwischen Maschine und Mensch vorangekommen. Unsere von Grund auf neu entwickelte Technologie ermöglicht den Einzug der Sprache in das tägliche Leben mit elektronischen Geräten. PCs und PDAs sind da erst der Anfang“, konstatierte G-Data-Vorstand Fridolin Rummel.

Die neuartige Sprachtechnologie beruht auf der selbst entwickelten Mikrosegmentsynthese, die es ermöglicht, aus nur 380 Lautbausteinen (Mikrosegmenten) jedes Wort einer Sprache verständlich und menschlich darzustellen. LOGOX4 habe laut den Entwicklern mit der Vorgänger-Version LOGOX3 außer dem grundlegenden Verfahren nichts mehr gemeinsam.

Entscheidend für die Qualitätssteigerung der neuen Sprachtechnologie seien die flexible Systemarchitektur, die verbesserte Textanalyse sowie die neu konzipierte Signalverarbeitung. Für eine verfeinerte Sprachqualität soll die intelligente Transformation von Text in Ton-Signale sorgen. Sie ermöglicht durch Satzanalysen eine „deutlich menschlichere“ Sprechmelodie und einen variableren Sprecherrhythmus.

Zudem könne der Anwender Sprechgeschwindigkeit, Tonhöhe sowie Intonation nach seinen Vorlieben einstellen. Die neue Architektur mit der einhergehenden Flexibilität ermöglichen sogar echte Weltneuheiten: Mit LOGOX4 kann der Computer nun sogar singen oder in Dialekten sprechen.

Die neue LOGOX4-Engine wurde in plattformunabhängigem Code entwickelt. Umsetzungen sind für Windows und Windows CE vorhanden. Das Programm soll nur 1,5 MByte Speicherplatz mit einer Stimme benötigen. LOGOX4 hat damit das Potential, neben dem Einsatz in Organizern mittelfristig als auch Technologie für Sprachchips in Mobiltelefonen, Navigationssystemen, elektronischen Spielzeugen und auch in Haushaltsgeräten zum Einsatz zu kommen, so G-Data.

Als Mindestvoraussetzungen für ein System nennt der Hersteller einen PC mit 200 MHz, 16 MByte RAM, Win 9x/ ME/ 2000/ XP sowie Internet Explorer ab Version 4.0. Empfohlen wird ein Pentium III mit 64 MByte RAM und Internet Explorer Version 5.0.

Kontakt:
G Data, Tel.: 0234/97620 (günstigsten Tarif anzeigen)

ZDNet.de Redaktion

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

5 Tagen ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

1 Woche ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

1 Woche ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

1 Woche ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

1 Woche ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

1 Woche ago