Labels wichtiger als Modelle: Supervised TSAD dominiert mit wenigen Daten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Welt der Zeitreihenanomalieerkennung (TSAD) gilt bislang die Annahme, dass komplexe Modelle die Lösung sind. Doch neue Forschungsergebnisse zeigen, dass gerade die Verfügbarkeit von wenigen, aber gezielten Labels einen viel größeren Einfluss auf die Leistung hat als die architektonische Komplexität.

Ein Team von Forschern hat die bislang fehlende systematische Gegenüberstellung von überwachten und unüberwachten TSAD-Ansätzen durchgeführt. Dabei wurde ein schlanker, überwachte Baseline-Ansatz namens STAND entwickelt, der mit minimalem Labeling-Budget arbeitet.

Die umfangreichen Experimente auf fünf öffentlichen Datensätzen verdeutlichen drei zentrale Erkenntnisse: Erstens übertreffen einfache überwachte Modelle unter begrenztem Labeling-Budget die derzeit führenden unüberwachten Methoden. Zweitens liefert selbst ein kleiner Anteil an Supervision einen deutlich höheren Nutzen als die Einführung neuer, komplexer Architekturen. Drittens zeigt STAND eine bessere Vorhersagekonsistenz und eine präzisere Lokalisierung von Anomalien.

Diese Befunde rufen zu einem datenorientierten Paradigmenwechsel in der TSAD-Forschung auf: Statt ausschließlich auf algorithmische Raffinesse zu setzen, sollten Entwickler und Forscher verstärkt in die Gewinnung und Nutzung von Labels investieren. Der zugehörige Code ist öffentlich zugänglich unter https://github.com/EmorZz1G/STAND.

Ähnliche Artikel