Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, eine Software zu entwickeln, die Tierstimmen erkennen kann. Für seine Diplomarbeit auf dem eher vernachlässigten Forschungsgebiet der Geräuscherkennung wurde Matthias Zeppelzauer mit dem von österreichischen IT-Unternehmen geförderten PRIP-Preis ausgezeichnet. Bisher existierten nur wenige Techniken für die Erkennung von Umgebungsgeräuschen, da sich die Forschung auf dem Gebiet der Audioverarbeitung meist auf die Erkennung von Sprache und Musik konzentriert. Die meisten Geräusche, mit denen der Mensch täglich konfrontiert ist, sind jedoch Umgebungsgeräusche.
Zeppelzauer orientierte sich bei seiner Entwicklung an Methoden zur Spracherkennung und Möglichkeiten aus dem Gebiet des Music Information Retrieval, das sich mit der Gewinnung von verwertbaren Informationen aus der Musik befasst. „Das System muss man zunächst trainieren, indem man die zu erkennenden Geräusche in eine Datenbank eingibt und die Tierstimmen dem jeweiligen Tier zuordnet“, erklärt Zeppelzauer seine Erfindung. Abhängig davon, welche Geräusche man einspeist, kann die Software nicht nur Tierstimmen, sondern zum Beispiel auch verschiedene Quellen des Straßenlärms unterscheiden.
Aus den Geräuschen der Datenbank werden in einem ersten Schritt Merkmale extrahiert. Um möglichst viele Informationen zur Verfügung zu haben, kombiniert die Software mehrere dieser unabhängigen Merkmale miteinander. Zeppelzauer entwickelte zudem eine neue Gruppe von Merkmalen, so genannte Amplituden Deskriptoren, welche die Eigenschaften des Audio-Signals genau analysieren und eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche ermöglichen. Mit Hilfe eines Algorhythmus, der auf bekannte Geräusche trainiert wird, kann ein Klassifikator schließlich für jedes Geräusch die wahrscheinlichste Quelle errechnet.
Von ihr geht ein hohes Risiko aus. Angreifbar sind Chrome für Windows, macOS und Linux.
Forschende des KIT haben ein Modell zur Emotionsanalyse entwickelt, das affektive Zustände ähnlich genau wie…
Sie decken die Identität des Kopfs der Gruppe auf. Britische Behörden fahnden mit einem Foto…
Er treibt das neue iPad Pro mit OLED-Display an. Apple verspricht eine deutliche Leistungssteigerung gegenüber…
Davon entfällt ein Viertel auf staatliche Einrichtungen und 12 Prozent auf Industrieunternehmen.
Forscher umgehen die Verschlüsselung und erhalten Zugriff auf VPN-Datenverkehr im Klartext. Für ihren Angriff benötigen…