Suche nach Audio- und Videodateien im Netz soll einfacher werden

Die rasche Zunahme schneller Internetzugänge weltweit hat dazu geführt, dass immer mehr Audio- und Videostreams im Internet angeboten werden. Im Vergleich zu normalen HTML-Websites, deren Texte problemlos katalogisiert und durchsucht werden können, bleibt der genaue Inhalt von Sound- und Videodateien heute vielfach verschlossen.

Solche Inhalte werden heute überwiegend auf Basis von Metadaten katalogisiert, die von den jeweiligen Anbietern meistens händisch dazugefügt werden und selten die wirklichen Inhalte der Dateien in allen Facetten repräsentieren.

Mit diesem Problem hatte auch das „National Public Radio“ zu kämpfen, auf dessen Website verschiedene Programme als Stream zur Verfügung stehen. Problematisch für den Anbieter war, dass dieser Content von den großen Suchmaschinen wie Google und Yahoo nicht erfasst werden kann.

Inzwischen hat das NPR jedoch einen Workaround entwickelt, der viele neue Nutzer auf seine Seiten gelockt hat. NPR setzt auf eine Technologie, die mittels Spracherkennung den Inhalt der Streams in Texte umwandelt, die dann wiederum von normalen Text-basierten Suchmaschinen katalogisiert werden können.

Der von NPR gemachte Schritt zeigt deutlich die Grenzen der großen Suchmaschinen und eröffnet gleichzeitig hoch spezialisierten Unternehmen eine Marktlücke. In diesem Bereich engagieren sich derzeit unter anderem Singingfish, Streamsage, HP, Virage und Nexia.

Streamsage hat in den vergangenen drei Jahren eine Suchtechnologie entwickelt, die mit Hilfe von Spracherkennung den Inhalt von Audiodateien in Text umwandelt. Danach wird mittels kontextsensitiver Analyse versucht, die in den Texten besprochenen Themen zu erfassen.

Ein Nachteil dieser Methode ist jedoch, dass die Genauigkeit teilweise zu wünschen übrig lässt. Diese werde alleine durch den Einsatz von Spracherkennung um mindestes 20 Prozent reduziert. Weitere Verluste zieht der Einsatz der Textanalyse nach sich.

Streamsage hat zur Demonstration der Fähigkeiten seiner Software die Website campaignsearch.com ins Netz gestellt, auf der Audio- und Videodateien von George W. Bush und seinem Herausforderer John Kerry zu sehen sind. Das System kann beispielsweise eine 60-Minuten-Rede von Kerry analysieren und den Zeitabschnitt markieren, in dem der demokratische Präsidentschaftskandidat über Gesundheitspolitik spricht.

Noch steht die Entwicklung der Technologie ganz am Anfang. Da es die zunehmende Zahl von Mediendateien im Internet in Verbindung mit Suchmaschinen Nutzern in Zukunft ermöglichen könnte, ihr TV-Programm selbst zusammenzustellen, kommt dieser Technologie eine zentrale Bedeutung zu.

ZDNet.de Redaktion

Recent Posts

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

3 Stunden ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

4 Stunden ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

21 Stunden ago

Hacker missbrauchen Google Calendar zum Angriff auf Postfächer

Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…

2 Tagen ago

Bedrohungen in Europa: Schwachstellen in der Lieferkette dominieren

Hinter 84 Prozent der Zwischenfälle bei Herstellern stecken Schwachstellen in der Lieferkette. Auf dem Vormarsch…

2 Tagen ago

Bericht: Apple arbeitet an faltbarem iPad

Es kommt angeblich 2028 auf den Markt. Das aufgeklappte Gerät soll die Displayfläche von zwei…

3 Tagen ago