VAE mit hypersphärischen Koordinaten: Anomalieerkennung verbessert
In einer neuen Studie wird gezeigt, wie Variationsautoencoder (VAEs) durch die Verwendung hypersphärischer Koordinaten ihre Fähigkeit zur Erkennung von Ausreißern deutlich steigern können. Traditionell werden Daten in ein niedrigdimensionales latentes Vektorformat kodiert, doch bei hoher Dimensionalität wächst das Hypervolumen exponentiell, was die generative Leistung des Modells stark beeinträchtigt. Darüber hinaus liegen die latenten Vektoren eines Standard‑VAE typischerweise auf den „Äquatoren“ einer Hypersphäre, was die Unterscheidung von Anomalien erschwert.
Die Autoren schlagen vor, die latenten Variablen in hypersphärische Koordinaten zu überführen. Dadurch können die Vektoren gezielt in Richtung einer definierten Achse auf der Hypersphäre komprimiert werden, was zu einer ausdrucksstärkeren Annäherung der Posteriorverteilung führt. Dieser Ansatz reduziert die effektive Dimensionalität und verbessert sowohl die vollständig unüberwachte als auch die außerhalb der Verteilung (OOD)-Anomalieerkennung.
Die Ergebnisse zeigen, dass das neue Modell auf einer Vielzahl von Datensätzen die bisher beste Leistung erzielt. Dazu gehören die Erkennung ungewöhnlicher Landschaften aus Mars‑Rover‑Kamerabildern, das Auffinden seltsamer Galaxien in bodengestützten Aufnahmen sowie Standardbenchmarks wie Cifar10 und ausgewählte ImageNet‑Untergruppen als innerhalb der Verteilung (In‑Distribution)-Klasse.