Einheitliches Modell erklärt, wann Lernbias gleichwertig sind

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Maschinelles Lernen leidet an einer Vielzahl von Fehlerquellen: von Diskriminierung gegenüber geschützten Gruppen über Anfälligkeit für trügerische Korrelationen bis hin zu schlechter Leistung bei Minderheitensubpopulationen. Diese Probleme werden bislang von unterschiedlichen Forschungsgemeinschaften getrennt untersucht.

In einer neuen Arbeit wird ein einheitliches theoretisches Rahmenwerk vorgestellt, das aufzeigt, wann verschiedene Bias-Mechanismen zu identischen Auswirkungen auf die Modellleistung führen. Die Autoren formulieren Bias als Verletzungen der bedingten Unabhängigkeit und nutzen informationstheoretische Messgrößen, um Gleichwertigkeitsbedingungen zwischen spurious correlations, Subpopulation Shift, Klassenungleichgewicht und Fairness-Verletzungen abzuleiten.

Ein besonders auffälliges Ergebnis lautet: Eine spurious correlation mit Stärke α erzeugt dieselbe Verschlechterung der Worst-Group-Accuracy wie ein Subpopulation‑Imbalance‑Ratio r ≈ (1+α)/(1−α), vorausgesetzt die Merkmale überschneiden sich. Durch Experimente an sechs Datensätzen und drei Architekturen konnte die Theorie innerhalb einer Genauigkeit von 3 % bestätigt werden, was die Übertragbarkeit von Debiasing‑Methoden zwischen verschiedenen Problemdomänen ermöglicht.

Damit schafft die Studie einen gemeinsamen Blickwinkel für die Literatur zu Fairness, Robustheit und Distribution Shift und eröffnet neue Wege, Bias‑Reduktion systematisch zu kombinieren und zu transferieren.

Ähnliche Artikel