Dolmetscher-Software von Microsoft behält Originalstimme bei

Microsofts Chief Research Officer Rick Rashid hat in einem Blogbeitrag eine neuartige Dolmetscher-Software vorgestellt. Sie überträgt nicht nur die Aussage eines Sprechers vom Englischen ins Mandarin-Chinesisch, sondern bildet dabei auch die Originalstimme nach.

Dazu verwendet Microsoft eine Technik, die es als Deep Neural Networks oder kurz DNN bezeichnet. Sie ist in Kooperation mit der Universität Toronto entstanden und verfolgt einen neuen Ansatz: Übliche Übersetzungssoftware modelliert Sprache als verborgene Markow-Kette, verwendet also Trainingsdaten für Vorhersagen. Im Gegensatz dazu nutzt DNN Gehirnströme, um die Spracherkennung zu verbessern.

Rashid zufolge produziert Microsoft mit Dolmetschen per DNN um etwa 30 Prozent weniger Fehler als mit der Markow-Modellierung. Statt einem Fehler alle vier bis fünf Wörter irre DNN nur etwa alle sieben bis acht Wörter.

„Das ist zwar noch längst nicht perfekt, aber die dramatischste Verbesserung der Genauigkeit seit der Einführung des Markow-Modells 1979. Wenn wir nun weitere Daten gewinnen, hoffen wir auf noch bessere Ergebnisse“, schreibt der Forschungsleiter in seinem Blogbeitrag. In einigen Jahren hoffe man, Sprachbarrieren komplett zu überwinden.

Konkret sind laut Microsoft mehrere Stunden umfassende Sprachaufzeichnungen eines Chinesischsprechenden nötig. Die Stimme des zu übersetzenden Sprechers nimmt Microsoft etwa eine Stunde lang auf, bevor es mit einer Korrelation der Daten beginnen kann.

Microsoft Research hat die Dolmetscher-Technik schon letzten Monat in China demonstriert. Die Präsentation ist als Video verfügbar.

[mit Material von Don Reisinger, News.com]

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Digitale Souveränität: Provider entwickeln API-Standard

Lösung soll den Aufbau des EuroStacks unterstützen, der Europas souveräne digitale Infrastruktur werden soll.

1 Stunde ago

FlexiSpot als eine der „The Major German Brands 2025“ ausgezeichnet

Auszeichnung unterstreicht das Engagement von FlexiSpot für nachhaltiges und ergonomisches Design sowie seinen Beitrag zur…

2 Tagen ago

Test: Ergonomischer Bürostuhl Doro C300 von SIHOO punktet durch Tracking der Bewegungen

Der Büro- und Gamerstuhl erkennt Gewicht der Nutzer und unterstützt Lendenwirbel und Nacken in jeder…

4 Tagen ago

Bericht: Faltbares iPhone kommt frühestens 2026

Der Analyst Ming-Chi Kuo geht von einem Preis zwischen 2000 und 2500 Dollar aus. Trotzdem…

4 Tagen ago

Trojaner-Angriffe verdreifacht

Kaspersky meldet starke Zunahme mobiler Banking-Trojaner. Insgesamt 33,3 Millionen Angriffe auf mobile Nutzer im Jahr…

5 Tagen ago

Höherer Durchsatz in Glasfasernetzen

Optische Schalter mit Flüssigkristallspiegeln sollen die Datenpakete so stark verkleinern, dass mehr Daten durchs Netz…

5 Tagen ago