Suche nach Audio- und Videodateien im Netz soll einfacher werden

Die rasche Zunahme schneller Internetzugänge weltweit hat dazu geführt, dass immer mehr Audio- und Videostreams im Internet angeboten werden. Im Vergleich zu normalen HTML-Websites, deren Texte problemlos katalogisiert und durchsucht werden können, bleibt der genaue Inhalt von Sound- und Videodateien heute vielfach verschlossen.

Solche Inhalte werden heute überwiegend auf Basis von Metadaten katalogisiert, die von den jeweiligen Anbietern meistens händisch dazugefügt werden und selten die wirklichen Inhalte der Dateien in allen Facetten repräsentieren.

Mit diesem Problem hatte auch das „National Public Radio“ zu kämpfen, auf dessen Website verschiedene Programme als Stream zur Verfügung stehen. Problematisch für den Anbieter war, dass dieser Content von den großen Suchmaschinen wie Google und Yahoo nicht erfasst werden kann.

Inzwischen hat das NPR jedoch einen Workaround entwickelt, der viele neue Nutzer auf seine Seiten gelockt hat. NPR setzt auf eine Technologie, die mittels Spracherkennung den Inhalt der Streams in Texte umwandelt, die dann wiederum von normalen Text-basierten Suchmaschinen katalogisiert werden können.

Der von NPR gemachte Schritt zeigt deutlich die Grenzen der großen Suchmaschinen und eröffnet gleichzeitig hoch spezialisierten Unternehmen eine Marktlücke. In diesem Bereich engagieren sich derzeit unter anderem Singingfish, Streamsage, HP, Virage und Nexia.

Streamsage hat in den vergangenen drei Jahren eine Suchtechnologie entwickelt, die mit Hilfe von Spracherkennung den Inhalt von Audiodateien in Text umwandelt. Danach wird mittels kontextsensitiver Analyse versucht, die in den Texten besprochenen Themen zu erfassen.

Ein Nachteil dieser Methode ist jedoch, dass die Genauigkeit teilweise zu wünschen übrig lässt. Diese werde alleine durch den Einsatz von Spracherkennung um mindestes 20 Prozent reduziert. Weitere Verluste zieht der Einsatz der Textanalyse nach sich.

Streamsage hat zur Demonstration der Fähigkeiten seiner Software die Website campaignsearch.com ins Netz gestellt, auf der Audio- und Videodateien von George W. Bush und seinem Herausforderer John Kerry zu sehen sind. Das System kann beispielsweise eine 60-Minuten-Rede von Kerry analysieren und den Zeitabschnitt markieren, in dem der demokratische Präsidentschaftskandidat über Gesundheitspolitik spricht.

Noch steht die Entwicklung der Technologie ganz am Anfang. Da es die zunehmende Zahl von Mediendateien im Internet in Verbindung mit Suchmaschinen Nutzern in Zukunft ermöglichen könnte, ihr TV-Programm selbst zusammenzustellen, kommt dieser Technologie eine zentrale Bedeutung zu.

ZDNet.de Redaktion

Recent Posts

Gefahren im Foxit PDF-Reader

Check Point warnt vor offener Schwachstelle, die derzeit von Hackern für Phishing ausgenutzt wird.

2 Tagen ago

Bitdefender entdeckt Sicherheitslücken in Überwachungskameras

Video-Babyphones sind ebenfalls betroffen. Cyberkriminelle nehmen vermehrt IoT-Hardware ins Visier.

2 Tagen ago

Top-Malware in Deutschland: CloudEye zurück an der Spitze

Der Downloader hat hierzulande im April einen Anteil von 18,58 Prozent. Im Bereich Ransomware ist…

2 Tagen ago

Podcast: „Die Zero Trust-Architektur ist gekommen, um zu bleiben“

Unternehmen greifen von überall aus auf die Cloud und Applikationen zu. Dementsprechend reicht das Burg-Prinzip…

3 Tagen ago

Google schließt weitere Zero-Day-Lücke in Chrome

Hacker nutzen eine jetzt gepatchte Schwachstelle im Google-Browser bereits aktiv aus. Die neue Chrome-Version stopft…

3 Tagen ago

Hacker greifen Zero-Day-Lücke in Windows mit Banking-Trojaner QakBot an

Microsoft bietet seit Anfang der Woche einen Patch für die Lücke. Kaspersky-Forscher gehen davon aus,…

3 Tagen ago