Neuer Shapley-Wert berücksichtigt Prioritäten – Genauigkeit in Datenbewertung
In der Welt der datengetriebenen Modelle ist der Shapley-Wert ein bewährtes Werkzeug zur Bewertung von Daten und zur Attribution von Merkmalen. Doch bisher wurde dabei immer angenommen, dass alle Beitragenden gleichwertig und austauschbar sind – ein Ansatz, der bei abhängigen Daten oder bei unterschiedlichen Vertrauens- und Risikofaktoren zu Ungenauigkeiten führen kann.
Die neue Methode, der Priority‑Aware Shapley Value (PASV), löst dieses Problem, indem sie sowohl harte Präzedenzregeln als auch weiche, beitragsabhängige Prioritätsgewichte einbezieht. PASV funktioniert für beliebige Präzedenzstrukturen, vereint die klassischen Varianten des Shapley‑Werts als Sonderfälle und lässt sich durch natürliche Axiome eindeutig beschreiben.
Zur effizienten Monte‑Carlo‑Schätzung wurde ein adjazenter‑Swap‑Metropolis‑Hastings‑Sampler entwickelt, der die Berechnung skalierbar macht. In Experimenten mit MNIST, CIFAR‑10 und dem Census‑Income‑Datensatz zeigte PASV strukturtreuere Verteilungen und ermöglichte eine praktische Sensitivitätsanalyse über die vorgeschlagene „Priority‑Sweeping“-Technik.