Categories: Software

Software erkennt Tierstimmen

Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, eine Software zu entwickeln, die Tierstimmen erkennen kann. Für seine Diplomarbeit auf dem eher vernachlässigten Forschungsgebiet der Geräuscherkennung wurde Matthias Zeppelzauer mit dem von österreichischen IT-Unternehmen geförderten PRIP-Preis ausgezeichnet. Bisher existierten nur wenige Techniken für die Erkennung von Umgebungsgeräuschen, da sich die Forschung auf dem Gebiet der Audioverarbeitung meist auf die Erkennung von Sprache und Musik konzentriert. Die meisten Geräusche, mit denen der Mensch täglich konfrontiert ist, sind jedoch Umgebungsgeräusche.

Zeppelzauer orientierte sich bei seiner Entwicklung an Methoden zur Spracherkennung und Möglichkeiten aus dem Gebiet des Music Information Retrieval, das sich mit der Gewinnung von verwertbaren Informationen aus der Musik befasst. „Das System muss man zunächst trainieren, indem man die zu erkennenden Geräusche in eine Datenbank eingibt und die Tierstimmen dem jeweiligen Tier zuordnet“, erklärt Zeppelzauer seine Erfindung. Abhängig davon, welche Geräusche man einspeist, kann die Software nicht nur Tierstimmen, sondern zum Beispiel auch verschiedene Quellen des Straßenlärms unterscheiden.

Aus den Geräuschen der Datenbank werden in einem ersten Schritt Merkmale extrahiert. Um möglichst viele Informationen zur Verfügung zu haben, kombiniert die Software mehrere dieser unabhängigen Merkmale miteinander. Zeppelzauer entwickelte zudem eine neue Gruppe von Merkmalen, so genannte Amplituden Deskriptoren, welche die Eigenschaften des Audio-Signals genau analysieren und eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche ermöglichen. Mit Hilfe eines Algorhythmus, der auf bekannte Geräusche trainiert wird, kann ein Klassifikator schließlich für jedes Geräusch die wahrscheinlichste Quelle errechnet.

ZDNet.de Redaktion

Recent Posts

Google schließt Zero-Day-Lücke in Chrome

Von ihr geht ein hohes Risiko aus. Angreifbar sind Chrome für Windows, macOS und Linux.

1 Tag ago

KI erkennt Emotionen in echten Sportsituationen

Forschende des KIT haben ein Modell zur Emotionsanalyse entwickelt, das affektive Zustände ähnlich genau wie…

2 Tagen ago

Ermittlern gelingt weiterer Schlag gegen Ransomware-Gruppe LockBit

Sie decken die Identität des Kopfs der Gruppe auf. Britische Behörden fahnden mit einem Foto…

3 Tagen ago

Apple stellt neuen Mobilprozessor M4 vor

Er treibt das neue iPad Pro mit OLED-Display an. Apple verspricht eine deutliche Leistungssteigerung gegenüber…

3 Tagen ago

Cyberabwehr: Mindestens zwei kritische Vorfälle pro Tag

Davon entfällt ein Viertel auf staatliche Einrichtungen und 12 Prozent auf Industrieunternehmen.

3 Tagen ago

Tunnelvision: Exploit umgeht VPN-Verschlüsselung

Forscher umgehen die Verschlüsselung und erhalten Zugriff auf VPN-Datenverkehr im Klartext. Für ihren Angriff benötigen…

3 Tagen ago