Spracherkennung verschafft Google Zugang zu TV

Google will in Zukunft parallel zu Fernsehsendungen Informationen via PC liefern, berichtet die Informationweek. Damit könnten sich unter anderem neue Marketingmethoden für die Werbebranche eröffnen.

In einem Blog schlagen zwei Google-Forscher vor, eine so genannte Ambient-Audio-Identifikation-Technologie zu verwenden, um den Ton des Fernsehers via PC einzufangen, die laufende Sendung zu identifizieren und direkt Such-Ergebnisse dazu über Google zu bekommen. „Das System kann den Benutzern folgen, während sie durch die Kanäle schalten, ihnen ein Echtzeit-Forum einer politischen Debatte in der einen Minute präsentieren und einen Ad-hoc-Chatroom zu einem Sportereignis in der nächsten“, schreiben Michele Covell und Shumeet Baluja im Google-Research-Blog.

Marketingspezialisten sehen in der kombinierten Suchfunktion über Fernsehton und Internet eine neue Werbemöglichkeit: Denn sie sind immer daran interessiert, so viele Informationen über den Kunden zu sammeln wie möglich, um genau zu wissen, wer welche Sendung zu welchem Zeitpunkt ansieht. Auch zusätzliche, kundenspezifische Informationen über Produkte und Dienstleistungen wären denkbar, so dass der neue Service auch Kundenbindungsstrategien unterstützen könnte. Schließlich gebe es immer mehr erlebnisorientierte Konsumenten, die auf maßgeschneiderte Angebote geradezu warten. Oft besäßen Unternehmen nicht die notwendigen Strukturen, um herauszufinden, mit welchen Dienstleistungen sie ihre Kunden am besten an sich binden könnten, erklärt Thorsten Posselt, Professor für Handels- und Dienstleistungsmanagement an der Bergischen Universität Wuppertal.

Diese Lücke könnte das neue Google-Angebot schließen. Dass die Sprachdialogtechnik solche Aufgaben lösen kann sei unbestritten, meint Bernhard Steimel, Sprecher der Brancheninitiative Voice Business, die in diesem Jahr zum dritten Mal die Bonner Voice Days veranstaltet: „Sprachanwendungen haben sich in den vergangenen zwei Jahren rasant weiterentwickelt und sind vielfältig einsetzbar“. Getrieben von der wachsenden Bedeutung des mobilen Internets werde die Sprachautomatisierung für unterschiedliche Einsatzzwecke mit anderen Medien zusammengeführt.

Spracherkennung und Sprachausgabe, ob netzbasiert oder im Endgerät eingebaut als Bedienfunktion, solle mit graphischen Benutzerschnittstellen sinnvoll zusammenwirken. „Dafür müssen technologische Kompetenzen aus unterschiedlichen Fachgebieten der Sprachtechnologie zusammengeführt werden, wie das Erkennen großer Wortschätze, das sinnvolle Interpretieren von Antworten auf offene Fragen und das Suchen in einem semantischen Kontext. Erst wenn das gelingt, kann die Vision Wirklichkeit werden und auch komplexe Such-Services wie Google ihre Macht im Voice Web entfalten“, prognostiziert Steimel.

ZDNet.de Redaktion

Recent Posts

Microsoft nennt weitere Details zu kostenpflichtigen Patches für Windows 10

Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…

14 Stunden ago

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

1 Tag ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

1 Tag ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

1 Tag ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

2 Tagen ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

2 Tagen ago