Suche nach Audio- und Videodateien im Netz soll einfacher werden

Die rasche Zunahme schneller Internetzugänge weltweit hat dazu geführt, dass immer mehr Audio- und Videostreams im Internet angeboten werden. Im Vergleich zu normalen HTML-Websites, deren Texte problemlos katalogisiert und durchsucht werden können, bleibt der genaue Inhalt von Sound- und Videodateien heute vielfach verschlossen.

Solche Inhalte werden heute überwiegend auf Basis von Metadaten katalogisiert, die von den jeweiligen Anbietern meistens händisch dazugefügt werden und selten die wirklichen Inhalte der Dateien in allen Facetten repräsentieren.

Mit diesem Problem hatte auch das „National Public Radio“ zu kämpfen, auf dessen Website verschiedene Programme als Stream zur Verfügung stehen. Problematisch für den Anbieter war, dass dieser Content von den großen Suchmaschinen wie Google und Yahoo nicht erfasst werden kann.

Inzwischen hat das NPR jedoch einen Workaround entwickelt, der viele neue Nutzer auf seine Seiten gelockt hat. NPR setzt auf eine Technologie, die mittels Spracherkennung den Inhalt der Streams in Texte umwandelt, die dann wiederum von normalen Text-basierten Suchmaschinen katalogisiert werden können.

Der von NPR gemachte Schritt zeigt deutlich die Grenzen der großen Suchmaschinen und eröffnet gleichzeitig hoch spezialisierten Unternehmen eine Marktlücke. In diesem Bereich engagieren sich derzeit unter anderem Singingfish, Streamsage, HP, Virage und Nexia.

Streamsage hat in den vergangenen drei Jahren eine Suchtechnologie entwickelt, die mit Hilfe von Spracherkennung den Inhalt von Audiodateien in Text umwandelt. Danach wird mittels kontextsensitiver Analyse versucht, die in den Texten besprochenen Themen zu erfassen.

Ein Nachteil dieser Methode ist jedoch, dass die Genauigkeit teilweise zu wünschen übrig lässt. Diese werde alleine durch den Einsatz von Spracherkennung um mindestes 20 Prozent reduziert. Weitere Verluste zieht der Einsatz der Textanalyse nach sich.

Streamsage hat zur Demonstration der Fähigkeiten seiner Software die Website campaignsearch.com ins Netz gestellt, auf der Audio- und Videodateien von George W. Bush und seinem Herausforderer John Kerry zu sehen sind. Das System kann beispielsweise eine 60-Minuten-Rede von Kerry analysieren und den Zeitabschnitt markieren, in dem der demokratische Präsidentschaftskandidat über Gesundheitspolitik spricht.

Noch steht die Entwicklung der Technologie ganz am Anfang. Da es die zunehmende Zahl von Mediendateien im Internet in Verbindung mit Suchmaschinen Nutzern in Zukunft ermöglichen könnte, ihr TV-Programm selbst zusammenzustellen, kommt dieser Technologie eine zentrale Bedeutung zu.

ZDNet.de Redaktion

Recent Posts

Recall: Microsoft stellt KI-gestützte Timeline für Windows vor

Recall hilft beim Auffinden von beliebigen Dateien und Inhalten. Die neue Funktion führt Microsoft zusammen…

2 Stunden ago

Windows 10 und 11: Microsoft behebt Problem mit VPN-Verbindungen

Es tritt auch unter Windows Server auf. Seit Installation der April-Patches treten Fehlermeldungen bei VPN-Verbindungen…

8 Stunden ago

Portfoliomanagement Alfabet öffnet sich für neue Nutzer

Das neue Release soll es allen Mitarbeitenden möglich machen, zur Ausgestaltung der IT beizutragen.

12 Stunden ago

Gefahren im Foxit PDF-Reader

Check Point warnt vor offener Schwachstelle, die derzeit von Hackern für Phishing ausgenutzt wird.

4 Tagen ago

Bitdefender entdeckt Sicherheitslücken in Überwachungskameras

Video-Babyphones sind ebenfalls betroffen. Cyberkriminelle nehmen vermehrt IoT-Hardware ins Visier.

4 Tagen ago

Top-Malware in Deutschland: CloudEye zurück an der Spitze

Der Downloader hat hierzulande im April einen Anteil von 18,58 Prozent. Im Bereich Ransomware ist…

4 Tagen ago