Mit neuronalen Netzen lassen sich heutzutage verschiedene Klassifizierungs- und/oder Entscheidungsprobleme adressieren. Die dabei erzielten Genauigkeiten setzen oft Maßstäbe in ihrer jeweiligen Kategorie. Ein Problem der neuronalen Netze besteht in der großen nötigen Menge an Trainingsdaten, um besonders gute Modelle zu erhalten. Die Beschaffung dieser Daten stellt oftmals eine Herausforderung dar, da mit zunehmender Seltenheit der Daten meist auch die Schwierigkeit und die Kosten der Beschaffung steigen. An dieser Stelle können z.B. Support Vector Machine (SVM)-basierte Erkenner mit wenigen vorhandenen Daten trainiert werden um trotzdem gute Genauigkeiten zu erzielen.
Bei der akustischen Event Erkennung werden im Unterschied zur Spracherkennung jegliche Arten von Geräuschen erkannt und klassifiziert. Solche Erkenner werden eingesetzt zur Detektion von Gefahren (z.B. Glasbruch, Schüsse,...), Tiergeräuschen (z.B. Vögel), zur Überwachung von pflegebedürftigen Personen, etc. Besonders bei selten auftretenden Geräuschen ist es oft schwer und kostspielig größere Mengen von Daten aufzunehmen, um einen Event-Erkenner als neuronales Netz zu trainieren.
Im Laufe dieser Arbeit soll zunächst im Rahmen einer Literaturrecherche ein Überblick über aktuelle Methoden des Trainings von (akustischen Event-)Erkennern mit wenigen verfügbaren Trainingsdaten erarbeitet werden. Anschließend sollen ein oder zwei geeignete Methoden ausgewählt und damit ein Event-Erkenner trainiert werden. Hierfür steht eine Datenbank von isolierten Events mit je wenigen Events pro Klasse sowie ein "eventfreier" Datensatz aus Fahrzeuggeräusch zur Verfügung, aus welchen durch Mischung Trainings- und Testdaten generiert werden können.
Voraussetzungen: Python, Mustererkennung oder Sprachdialogsysteme wären vorteilhaft