Microsofts Chief Research Officer Rick Rashid hat in einem Blogbeitrag eine neuartige Dolmetscher-Software vorgestellt. Sie überträgt nicht nur die Aussage eines Sprechers vom Englischen ins Mandarin-Chinesisch, sondern bildet dabei auch die Originalstimme nach.
Dazu verwendet Microsoft eine Technik, die es als Deep Neural Networks oder kurz DNN bezeichnet. Sie ist in Kooperation mit der Universität Toronto entstanden und verfolgt einen neuen Ansatz: Übliche Übersetzungssoftware modelliert Sprache als verborgene Markow-Kette, verwendet also Trainingsdaten für Vorhersagen. Im Gegensatz dazu nutzt DNN Gehirnströme, um die Spracherkennung zu verbessern.
Rashid zufolge produziert Microsoft mit Dolmetschen per DNN um etwa 30 Prozent weniger Fehler als mit der Markow-Modellierung. Statt einem Fehler alle vier bis fünf Wörter irre DNN nur etwa alle sieben bis acht Wörter.
„Das ist zwar noch längst nicht perfekt, aber die dramatischste Verbesserung der Genauigkeit seit der Einführung des Markow-Modells 1979. Wenn wir nun weitere Daten gewinnen, hoffen wir auf noch bessere Ergebnisse“, schreibt der Forschungsleiter in seinem Blogbeitrag. In einigen Jahren hoffe man, Sprachbarrieren komplett zu überwinden.
Konkret sind laut Microsoft mehrere Stunden umfassende Sprachaufzeichnungen eines Chinesischsprechenden nötig. Die Stimme des zu übersetzenden Sprechers nimmt Microsoft etwa eine Stunde lang auf, bevor es mit einer Korrelation der Daten beginnen kann.
Microsoft Research hat die Dolmetscher-Technik schon letzten Monat in China demonstriert. Die Präsentation ist als Video verfügbar.
[mit Material von Don Reisinger, News.com]
Fast zwei Drittel halten jedoch eine Umsetzung aller Vorgaben von NIS 2 bis Jahresende für…
Mit dem Dekryptor von Bitdefender können Opfer von Attacken mit der Shrinklocker-Ransomware Dateien wiederherstellen.
In der Vorweihnachtszeit ist vor allem Malvertising auf dem Vormarsch. Cyberkriminelle locken Nutzer über schädliche…
Dazu trägt unter der Infostealer Lumma-Stealer bei. Hierzulande dominiert der Infostealer Formbook die Malware-Landschaft.
Eine schwerwiegende Anfälligkeit hebelt die Sicherheitsfunktion Seitenisolierung auf. Betroffen sind Chrome für Windows, macOS und…
DeepL Voice ermöglicht Live‑Übersetzung von Meetings und Gesprächen in 13 Sprachen.