Whitening verbessert Erklärbarkeit von KI-Modellen – neue Studie zeigt Wirkung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Eine aktuelle Untersuchung auf arXiv (2602.09278v1) beleuchtet, wie das Pre‑Processing‑Verfahren Whitening die Zuverlässigkeit von Feature‑Attribution‑Methoden in der erklärbaren KI (XAI) beeinflusst. Die Autoren zeigen, dass viele gängige Attributionstechniken fälschlicherweise nicht‑informative Variablen als wichtig einstufen – ein Phänomen, das durch statistische Suppression entsteht.

Um zu prüfen, ob Whitening solche Fehler reduzieren kann, wurden 16 beliebte Attributionsmethoden mit fünf unterschiedlichen Whitening‑Transformen auf dem XAI‑TRIS‑Benchmark getestet. Dieser Teststand bietet synthetische Ground‑Truth‑Daten und quantitative Messgrößen für die Richtigkeit von Erklärungen. Zusätzlich analysierte die Studie ein minimalistisches lineares Zwei‑Dimensional‑Klassifikationsproblem, um theoretisch zu untersuchen, ob Whitening die Wirkung von Suppressor‑Features in Bayes‑optimalen Modellen eliminieren kann.

Die Ergebnisse zeigen, dass bestimmte Whitening‑Techniken die Erklärungsqualität verbessern, jedoch stark von der gewählten Attributionsmethode und dem Modellarchitektur abhängen. Diese Erkenntnisse unterstreichen die komplexe Wechselwirkung zwischen Daten‑Nichtlinearitäten, Pre‑Processing‑Qualität und der Genauigkeit von Attributionsanalysen. Sie verdeutlichen, dass sorgfältige Vorverarbeitung ein entscheidender Faktor ist, um die Interpretierbarkeit von KI‑Modellen zuverlässig zu erhöhen.

Ähnliche Artikel