Linear Probing nutzt vortrainierte Audio-Embeddings für UATR
Anthropogene Geräusche von Schiffen erhöhen die Unterwassergeräusche erheblich und gefährden marine Ökosysteme. Um die Auswirkungen dieser Schiffsgeräusche zu verstehen und zu quantifizieren, ist eine kontinuierliche Überwachung unerlässlich.
Passive Acoustic Monitoring (PAM)-Systeme werden weltweit eingesetzt und liefern jahrelange Aufnahmen aus unterschiedlichen Klanglandschaften. Die manuelle Analyse dieser riesigen Datenmengen ist jedoch nicht praktikabel, weshalb automatisierte Verfahren auf Basis von maschinellem Lernen dringend benötigt werden.
In der vorliegenden Studie wird erstmals ein systematischer Vergleich von Transfer‑Learning-Ansätzen für die Unterwasser-Akustik‑Zielerkennung (UATR) durchgeführt. Dabei werden mehrere vortrainierte Audio‑Modelle aus unterschiedlichen Domänen herangezogen, deren Gewichte eingefroren und die daraus resultierenden Embeddings für Klassifikation, Clustering und Ähnlichkeitsanalysen verwendet.
Die Analyse zeigt, dass die geometrische Struktur des Embedding‑Raums stark von aufnahme‑spezifischen Merkmalen dominiert wird. Ein einfacher linearer Probe-Ansatz kann jedoch diese Aufnahme‑spezifischen Informationen effektiv unterdrücken und die Merkmale von Schiffstypen isolieren. Dadurch ermöglicht linearer Probing eine effiziente automatische UATR mit vortrainierten Audio‑Modellen bei geringem Rechenaufwand und reduziert den Bedarf an umfangreichen gelabelten Datensätzen erheblich.