Neue Methode liefert realistische, vielfältige Gegenfaktische Erklärungen
Ein neues Verfahren namens DANCE (Diverse, Actionable, and kNowledge-Constrained Explanations) verspricht, die Erklärbarkeit von Machine‑Learning‑Modellen auf ein neues Level zu heben. Durch die Einbindung von Domänenwissen und kausalen Beschränkungen erzeugt DANCE Gegenfaktische Beispiele, die nicht nur minimal, sondern auch praktisch umsetzbar sind.
Traditionelle Ansätze zur Gegenfaktischen Analyse vernachlässigen häufig die komplexen Abhängigkeiten in realen Datensätzen. DANCE löst dieses Problem, indem es lineare und nichtlineare Einschränkungen aus den Daten lernt oder Expertengraphen nutzt. So bleiben die vorgeschlagenen Änderungen konsistent mit den tatsächlichen Feature‑Beziehungen und sind damit plausibel.
Die Methode wurde anhand eines realen Fallstudienprojekts mit Freshmail, dem größten E‑Mail‑Marketing‑Unternehmen Polens, entwickelt und in einem gemeinsamen R&D‑Projekt mit Sendguard getestet. Eine umfangreiche Evaluation auf 140 öffentlichen Datensätzen zeigt, dass DANCE im Vergleich zu bestehenden Techniken sowohl hinsichtlich Plausibilität als auch Vielfalt und Sparsity überdurchschnittliche Ergebnisse liefert.
Der Quellcode zur Reproduzierbarkeit der Ergebnisse ist auf GitHub verfügbar, sodass Forscher und Praktiker die Technik leicht in ihre eigenen Projekte integrieren können.