IDK‑S: Neuer Kernel‑Ansatz für schnelle Streaming‑Anomalieerkennung
Die Erkennung von Anomalien in Datenströmen stellt Forschung und Praxis vor große Herausforderungen. Man muss nicht nur hohe Genauigkeit bei sich wandelnden Verteilungen gewährleisten, sondern gleichzeitig in Echtzeit arbeiten.
Mit dem neuen Ansatz IDK‑S – einem inkrementellen, distributionsbasierten Kernel – wird dieses Problem elegant gelöst. Der Kern des Verfahrens liegt in einer dynamischen Repräsentation innerhalb des Kernel‑Mean‑Embedding‑Rahmens, die sich kontinuierlich an neue Daten anpasst.
Die Stärke von IDK‑S beruht auf zwei wesentlichen Innovationen. Erstens nutzt es die bewährten Eigenschaften des Isolation Distributional Kernel, einem Offline‑Detektor, der dank eines datenabhängigen Kernels bereits überlegene Leistungen gegenüber klassischen Methoden wie Isolation Forest und Local Outlier Factor erzielt hat. Zweitens implementiert es einen schlanken, inkrementellen Update‑Mechanismus, der die Rechenlast im Vergleich zum naiven Ansatz, bei dem das komplette Modell neu trainiert wird, deutlich reduziert – ohne die Erkennungsgenauigkeit zu beeinträchtigen. Statistisch ist das Ergebnis sogar mit dem vollständig retrainierten Modell identisch.
Umfangreiche Tests an dreizehn Benchmark‑Datensätzen zeigen, dass IDK‑S nicht nur eine überlegene Anomalieerkennung liefert, sondern auch wesentlich schneller arbeitet – häufig um ein ganzes Ordnungsmal schneller als aktuelle Spitzenmethoden.