Suche nach Audio- und Videodateien im Netz soll einfacher werden

Die rasche Zunahme schneller Internetzugänge weltweit hat dazu geführt, dass immer mehr Audio- und Videostreams im Internet angeboten werden. Im Vergleich zu normalen HTML-Websites, deren Texte problemlos katalogisiert und durchsucht werden können, bleibt der genaue Inhalt von Sound- und Videodateien heute vielfach verschlossen.

Solche Inhalte werden heute überwiegend auf Basis von Metadaten katalogisiert, die von den jeweiligen Anbietern meistens händisch dazugefügt werden und selten die wirklichen Inhalte der Dateien in allen Facetten repräsentieren.

Mit diesem Problem hatte auch das „National Public Radio“ zu kämpfen, auf dessen Website verschiedene Programme als Stream zur Verfügung stehen. Problematisch für den Anbieter war, dass dieser Content von den großen Suchmaschinen wie Google und Yahoo nicht erfasst werden kann.

Inzwischen hat das NPR jedoch einen Workaround entwickelt, der viele neue Nutzer auf seine Seiten gelockt hat. NPR setzt auf eine Technologie, die mittels Spracherkennung den Inhalt der Streams in Texte umwandelt, die dann wiederum von normalen Text-basierten Suchmaschinen katalogisiert werden können.

Der von NPR gemachte Schritt zeigt deutlich die Grenzen der großen Suchmaschinen und eröffnet gleichzeitig hoch spezialisierten Unternehmen eine Marktlücke. In diesem Bereich engagieren sich derzeit unter anderem Singingfish, Streamsage, HP, Virage und Nexia.

Streamsage hat in den vergangenen drei Jahren eine Suchtechnologie entwickelt, die mit Hilfe von Spracherkennung den Inhalt von Audiodateien in Text umwandelt. Danach wird mittels kontextsensitiver Analyse versucht, die in den Texten besprochenen Themen zu erfassen.

Ein Nachteil dieser Methode ist jedoch, dass die Genauigkeit teilweise zu wünschen übrig lässt. Diese werde alleine durch den Einsatz von Spracherkennung um mindestes 20 Prozent reduziert. Weitere Verluste zieht der Einsatz der Textanalyse nach sich.

Streamsage hat zur Demonstration der Fähigkeiten seiner Software die Website campaignsearch.com ins Netz gestellt, auf der Audio- und Videodateien von George W. Bush und seinem Herausforderer John Kerry zu sehen sind. Das System kann beispielsweise eine 60-Minuten-Rede von Kerry analysieren und den Zeitabschnitt markieren, in dem der demokratische Präsidentschaftskandidat über Gesundheitspolitik spricht.

Noch steht die Entwicklung der Technologie ganz am Anfang. Da es die zunehmende Zahl von Mediendateien im Internet in Verbindung mit Suchmaschinen Nutzern in Zukunft ermöglichen könnte, ihr TV-Programm selbst zusammenzustellen, kommt dieser Technologie eine zentrale Bedeutung zu.

ZDNet.de Redaktion

Recent Posts

Umfrage: Angestellte in Deutschland unterschätzen NIS-2-Richtlinie

Fast zwei Drittel halten jedoch eine Umsetzung aller Vorgaben von NIS 2 bis Jahresende für…

7 Stunden ago

Kostenloser Dekryptor für ShrinkLocker

Mit dem Dekryptor von Bitdefender können Opfer von Attacken mit der Shrinklocker-Ransomware Dateien wiederherstellen.

21 Stunden ago

Malwarebytes warnt vor Betrugsmaschen beim Weihnachtseinkauf

In der Vorweihnachtszeit ist vor allem Malvertising auf dem Vormarsch. Cyberkriminelle locken Nutzer über schädliche…

21 Stunden ago

Bedrohungsindex: Deutliche Zunahme von Infostealern im Oktober

Dazu trägt unter der Infostealer Lumma-Stealer bei. Hierzulande dominiert der Infostealer Formbook die Malware-Landschaft.

2 Tagen ago

Chrome 131 schließt zwölf Sicherheitslücken

Eine schwerwiegende Anfälligkeit hebelt die Sicherheitsfunktion Seitenisolierung auf. Betroffen sind Chrome für Windows, macOS und…

2 Tagen ago

DeepL Voice mit KI für Sprach- übersetzungen

DeepL Voice ermöglicht Live‑Übersetzung von Meetings und Gesprächen in 13 Sprachen.

2 Tagen ago