Neue Methode liefert formale Erklärungen für prototypbasierte Netzwerke
Case‑Based‑Reasoning‑Netzwerke sind lernende Modelle, die Vorhersagen auf Basis der Ähnlichkeit zwischen einem Eingabebeispiel und prototypischen Teilen von Trainingsdaten treffen. Durch die Hervorhebung der wichtigsten Prototypen können sie jede Entscheidung nachvollziehbar erklären und gelten daher als „interpretable by design“.
Allerdings zeigen neue Untersuchungen, dass diese Erklärungen in manchen Fällen irreführend sein können: mehrere Eingaben können unterschiedliche Vorhersagen liefern, während die gleiche Erklärung angezeigt wird. Das erschwert die Anwendung solcher Modelle in sicherheitskritischen Bereichen erheblich.
Um diesem Problem zu begegnen, wurde die Methode „Abductive Latent Explanations“ (ALEs) entwickelt. Inspiriert von formalem Explainable AI (FXAI) formuliert ALEs formale Bedingungen auf der latenten Repräsentation eines Beispiels, die die Vorhersage garantieren. So verbindet die Methode die inhärente Interpretierbarkeit von Prototypenmodellen mit den mathematischen Garantien von formalem XAI.
Die Autoren stellen einen solver‑freien, skalierbaren Algorithmus vor, der ALEs anhand von drei unterschiedlichen Paradigmen generiert. In umfangreichen Experimenten auf diversen Datensätzen – sowohl für Standard‑ als auch für feingranulare Bildklassifikation – wird die Machbarkeit und Wirksamkeit der Methode demonstriert. Der zugehörige Code ist unter https://github.com/julsoria/ale verfügbar.