Optimale Gegenfaktische Erklärungen für Baum-Ensembles in Millisekunden

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Gegenfaktische Erklärungen sind ein zentrales Werkzeug, um die Entscheidungen von Machine‑Learning‑Modellen nachvollziehbar zu machen. Für komplexe Modelle, insbesondere für Baum‑Ensembles, ist die exakte Berechnung dieser Erklärungen jedoch bislang sehr aufwendig.

Bei Baum‑Ensembles sind die Vorhersagen in einer großen Anzahl von achsenparallelen Hyperrektangeln konstant. Das bedeutet, dass die beste Gegenfaktische Lösung für einen Datenpunkt genau die Projektion auf das nächstgelegene Rechteck mit einer anderen Klasse ist. Bisherige Verfahren nutzen entweder heuristische Ansätze ohne Garantie für die Optimalität oder Mixed‑Integer‑Programming‑Modelle, die nicht für interaktive Anwendungen skalieren.

Die neue Methode, die als „Counterfactual Maps“ bezeichnet wird, nutzt diese geometrische Struktur aus. Jeder Baum‑Ensemble kann in eine kompakte Partition von beschrifteten Hyperrektangeln überführt werden. Die Suche nach einer Gegenfaktischen Lösung wird dann zu einem Problem, das den Generalisierten Voronoi‑Zelle des nächstgelegenen Rechtecks mit alternativer Klasse bestimmt.

Durch die Verwendung von volumetrischen k‑dimensionalen KD‑Bäumen entsteht ein exakter, amortisierter Algorithmus, der mit Branch‑and‑Bound‑Such nach dem nächsten Rechteck arbeitet, dabei optimale Zertifikate liefert und nach einer einmaligen Vorverarbeitung einen sublinearen durchschnittlichen Abfragezeitraum erreicht.

Experimentelle Tests auf mehreren realen Datensätzen aus hochriskanten Anwendungsbereichen zeigen, dass diese Technik weltweit optimale Gegenfaktische Erklärungen mit Millisekunden‑Latenz erzeugen kann – ein bedeutender Fortschritt für die praktische Einsatzfähigkeit von erklärbaren Modellen.

Ähnliche Artikel