Die rasche Zunahme schneller Internetzugänge weltweit hat dazu geführt, dass immer mehr Audio- und Videostreams im Internet angeboten werden. Im Vergleich zu normalen HTML-Websites, deren Texte problemlos katalogisiert und durchsucht werden können, bleibt der genaue Inhalt von Sound- und Videodateien heute vielfach verschlossen.
Solche Inhalte werden heute überwiegend auf Basis von Metadaten katalogisiert, die von den jeweiligen Anbietern meistens händisch dazugefügt werden und selten die wirklichen Inhalte der Dateien in allen Facetten repräsentieren.
Mit diesem Problem hatte auch das „National Public Radio“ zu kämpfen, auf dessen Website verschiedene Programme als Stream zur Verfügung stehen. Problematisch für den Anbieter war, dass dieser Content von den großen Suchmaschinen wie Google und Yahoo nicht erfasst werden kann.
Inzwischen hat das NPR jedoch einen Workaround entwickelt, der viele neue Nutzer auf seine Seiten gelockt hat. NPR setzt auf eine Technologie, die mittels Spracherkennung den Inhalt der Streams in Texte umwandelt, die dann wiederum von normalen Text-basierten Suchmaschinen katalogisiert werden können.
Der von NPR gemachte Schritt zeigt deutlich die Grenzen der großen Suchmaschinen und eröffnet gleichzeitig hoch spezialisierten Unternehmen eine Marktlücke. In diesem Bereich engagieren sich derzeit unter anderem Singingfish, Streamsage, HP, Virage und Nexia.
Streamsage hat in den vergangenen drei Jahren eine Suchtechnologie entwickelt, die mit Hilfe von Spracherkennung den Inhalt von Audiodateien in Text umwandelt. Danach wird mittels kontextsensitiver Analyse versucht, die in den Texten besprochenen Themen zu erfassen.
Ein Nachteil dieser Methode ist jedoch, dass die Genauigkeit teilweise zu wünschen übrig lässt. Diese werde alleine durch den Einsatz von Spracherkennung um mindestes 20 Prozent reduziert. Weitere Verluste zieht der Einsatz der Textanalyse nach sich.
Streamsage hat zur Demonstration der Fähigkeiten seiner Software die Website campaignsearch.com ins Netz gestellt, auf der Audio- und Videodateien von George W. Bush und seinem Herausforderer John Kerry zu sehen sind. Das System kann beispielsweise eine 60-Minuten-Rede von Kerry analysieren und den Zeitabschnitt markieren, in dem der demokratische Präsidentschaftskandidat über Gesundheitspolitik spricht.
Noch steht die Entwicklung der Technologie ganz am Anfang. Da es die zunehmende Zahl von Mediendateien im Internet in Verbindung mit Suchmaschinen Nutzern in Zukunft ermöglichen könnte, ihr TV-Programm selbst zusammenzustellen, kommt dieser Technologie eine zentrale Bedeutung zu.
Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.
Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…
Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…
Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…
Hinter 84 Prozent der Zwischenfälle bei Herstellern stecken Schwachstellen in der Lieferkette. Auf dem Vormarsch…
Es kommt angeblich 2028 auf den Markt. Das aufgeklappte Gerät soll die Displayfläche von zwei…