Nuance bringt Spracherkennungs-SDK für Smartphones

Nuance Communications hat ein Software Development Kit für Apples iOS und Google Android herausgebracht. Programmierer können ihre Apps damit um Spracherkennung erweitern.

Das SDK unterstützt Deutsch und Englisch, aber auch Französisch, Italienisch, Japanisch und Spanisch. Die Technologie ist Nuances Apps Dragon Dictation, Dragon Search sowie Vocalizer entnommen. Alle dienen letztlich dazu, gesprochene Sprache in Text umzuwandeln.

Um das SDK zu erhalten, müssen sich Entwickler kostenlos bei Nuance registrieren. Preise für die Nutzung der Spracherkennung in kommerziellen Apps hat der Anbieter nicht kommuniziert.

Spracherkennung ist auf Smartphones längst verfügbar – allerdings meist in Form ergänzender Apps. Google hat seine im Dezember personalisiert: Sie verknüpft alle eingegebenen Wörter mit einem Google-Konto und erstellt ein individuelles Sprachprofil. So soll sich die Qualität der Spracherkennung verbessern lassen. Einen Schritt weiter will Google mit einer Dolmetscher-Software gehen.

Interessant ist Spracherkennung für die freihändige Texteingabe, aber auch zu Lernzwecken: Das Online-Lernsystem „Babbel“ ermöglicht Nutzern so, ihre Aussprache zu testen. Sie ist in Form einer browserbasierte Echtzeitanalyse per Flash implementiert. Clients für iPhone und iPad sollen demnächst kommen.

Auch in IT-Systemen für Autos spielt Spracherkennung eine wichtige Rolle. Windows für Autos etwa verfügt über die Spracherkennung Tellme. Microsoft hat sie erst kürzlich aktualisiert: Windows Embedded Automotive 7 wird von Fiat, Ford und Nissan eingesetzt. Fahrzeuge mit der Neuauflage gibt es aber wohl erst in zwei Jahren.


Mit dem Dragon-SDK können iOS- und Android-Programmierer ihre Apps um Spracherkennung ergänzen (Bild: Nuance).

ZDNet.de Redaktion

Recent Posts

Microsoft nennt weitere Details zu kostenpflichtigen Patches für Windows 10

Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…

8 Stunden ago

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

1 Tag ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

1 Tag ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

1 Tag ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

1 Tag ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

1 Tag ago