Neue Methode erkennt Out-of-Distribution-Daten mit kontrafaktischer Distanz
Ein neues Verfahren aus der jüngsten arXiv-Publikation liefert eine präzise und erklärbare Möglichkeit, Out-of-Distribution‑(OOD)‑Daten zu erkennen. Während frühere Ansätze die Distanz von Merkmalen zu Entscheidungsgrenzen nutzten, setzt die aktuelle Arbeit auf kontrafaktische Erklärungen, um diese Distanz post‑hoc zu bestimmen.
Die Methode berechnet für ein gegebenes Eingabeobjekt die Entfernung zu den Entscheidungsgrenzen, indem sie kontrafaktische Beispiele erzeugt. Um die Rechenkosten bei großen Modellen zu reduzieren, werden die kontrafaktischen Erklärungen direkt im Einbettungsraum berechnet. Dadurch bleibt die Skalierbarkeit erhalten, ohne die Genauigkeit zu beeinträchtigen.
Ein großer Vorteil ist die nahtlose Integration von Erklärungen: Die kontrafaktischen Beispiele liefern nicht nur die Distanzmessung, sondern ermöglichen auch eine transparente Interpretation der OOD‑Erkennung. In den Benchmark‑Tests auf CIFAR‑10, CIFAR‑100 und ImageNet‑200 erzielt das Verfahren konkurrenzfähige Ergebnisse – 93,50 % AUROC und 25,80 % FPR95 bei CIFAR‑10, 97,05 % AUROC und 13,79 % FPR95 bei CIFAR‑100 sowie 92,55 % AUROC und 33,55 % FPR95 bei ImageNet‑200 – und übertrifft dabei mehrere etablierte Methoden über vier OOD‑Datensätze hinweg.