Rashomon-Effekt in Entscheidungsprozessen: Robustheit durch Ensemble-Strategien
In einer neuen Veröffentlichung auf arXiv wird der bekannte Rashomon-Effekt – bei dem mehrere Modelle dieselben Vorhersagen liefern, aber unterschiedliche interne Feature‑Gewichte nutzen – auf das Gebiet der sequentiellen Entscheidungsfindung übertragen. Dabei wird der Effekt als das Auftreten mehrerer Policies definiert, die exakt dieselben Zustände besuchen und dieselben Aktionen wählen, obwohl ihre interne Struktur, etwa die Feature‑Attributionen, verschieden ist.
Der Nachweis identischer Verhaltensweisen in sequentiellen Aufgaben ist komplexer als in klassischen Klassifikationsproblemen, weil stochastische Übergänge dazu führen können, dass dieselbe Policy auf einer einzelnen Trajektorie scheitert oder erfolgreich ist. Um diesem Problem zu begegnen, nutzt die Studie formale Verifikationsmethoden, die das vollständige probabilistische Verhalten jeder Policy im jeweiligen Umfeld aufbauen und vergleichen. Auf diese Weise lässt sich eindeutig feststellen, ob zwei Policies wirklich gleich handeln.
Die Experimente zeigen, dass der Rashomon-Effekt auch in sequentiellen Entscheidungsaufgaben existiert. Besonders interessant ist, dass Ensembles, die aus Policies des Rashomon‑Sets zusammengestellt werden, gegenüber Verteilungssprüngen deutlich robuster sind als einzelne Policies. Darüber hinaus führen permissive Policies, die aus dem Rashomon‑Set abgeleitet werden, zu einer erheblichen Reduktion der Rechenkosten bei der Verifikation, ohne dabei die optimale Leistung zu beeinträchtigen.