Microsofts Chief Research Officer Rick Rashid hat in einem Blogbeitrag eine neuartige Dolmetscher-Software vorgestellt. Sie überträgt nicht nur die Aussage eines Sprechers vom Englischen ins Mandarin-Chinesisch, sondern bildet dabei auch die Originalstimme nach.
Dazu verwendet Microsoft eine Technik, die es als Deep Neural Networks oder kurz DNN bezeichnet. Sie ist in Kooperation mit der Universität Toronto entstanden und verfolgt einen neuen Ansatz: Übliche Übersetzungssoftware modelliert Sprache als verborgene Markow-Kette, verwendet also Trainingsdaten für Vorhersagen. Im Gegensatz dazu nutzt DNN Gehirnströme, um die Spracherkennung zu verbessern.
Rashid zufolge produziert Microsoft mit Dolmetschen per DNN um etwa 30 Prozent weniger Fehler als mit der Markow-Modellierung. Statt einem Fehler alle vier bis fünf Wörter irre DNN nur etwa alle sieben bis acht Wörter.
„Das ist zwar noch längst nicht perfekt, aber die dramatischste Verbesserung der Genauigkeit seit der Einführung des Markow-Modells 1979. Wenn wir nun weitere Daten gewinnen, hoffen wir auf noch bessere Ergebnisse“, schreibt der Forschungsleiter in seinem Blogbeitrag. In einigen Jahren hoffe man, Sprachbarrieren komplett zu überwinden.
Konkret sind laut Microsoft mehrere Stunden umfassende Sprachaufzeichnungen eines Chinesischsprechenden nötig. Die Stimme des zu übersetzenden Sprechers nimmt Microsoft etwa eine Stunde lang auf, bevor es mit einer Korrelation der Daten beginnen kann.
Microsoft Research hat die Dolmetscher-Technik schon letzten Monat in China demonstriert. Die Präsentation ist als Video verfügbar.
[mit Material von Don Reisinger, News.com]
Neueste Kommentare
Noch keine Kommentare zu Dolmetscher-Software von Microsoft behält Originalstimme bei
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.