Fein abgestufte Erklärungen: Gegenfaktische Analyse für Fehlklassifikationen
In der Bildinterpretation liefern Attribution‑basierte Erklärungen wichtige Muster, doch sie bleiben oft zu grob, wenn es um feine Details geht – besonders bei Fehlklassifikationen, wo die Erklärungen nicht ausreichend präzise sind.
Um dieses Problem zu lösen, stellen die Autoren ein neues Framework vor, das Gegenfaktische Erklärungen auf feiner Ebene erzeugt. Dabei werden sowohl objekt- als auch partspezifische Interpretationen geliefert, die beantworten: Welche feinen Merkmale führen zur Fehlklassifikation und wo wirken dominante lokale Merkmale bei der Gegenfaktischen Anpassung?
Das Verfahren arbeitet ohne generative Modelle: Es misst die Ähnlichkeit und gewichtet die Beiträge einzelner Komponenten innerhalb interessierter Regionen zwischen korrekt klassifizierten und falsch klassifizierten Proben. Zusätzlich wird ein Saliency‑Partition‑Modul eingeführt, das auf Shapley‑Werten basiert und regionenspezifisch relevante Features isoliert.
Umfangreiche Experimente zeigen, dass das neue Verfahren feinere, intuitiv verständliche Regionen erfasst und damit bestehende feingranulare Methoden übertrifft.