SHLIME: Schutz vor feindlichen Angriffen auf SHAP und LIME
In einer aktuellen Studie wird gezeigt, dass die beliebten Post‑hoc‑Erklärungswerkzeuge LIME und SHAP – die häufig zur Aufdeckung von Bias in Black‑Box‑Modellen eingesetzt werden – anfällig für gezielte Angriffe sind. Durch gezielte Manipulationen können diese Methoden täuschend echte, aber irreführende Interpretationen liefern, die versteckte Vorurteile verbergen.