Gerechte Klassifikation mit kalibrierten Scores: Optimale Entscheidungen unter Suffizienz
In der überwachten Lernforschung ist die binäre Klassifikation anhand vorhergesagter Wahrscheinlichkeiten ein zentrales Problem. Traditionell wird dafür ein einziger Schwellenwert verwendet, der Bayes-optimal ist, wenn…
- In der überwachten Lernforschung ist die binäre Klassifikation anhand vorhergesagter Wahrscheinlichkeiten ein zentrales Problem.
- Traditionell wird dafür ein einziger Schwellenwert verwendet, der Bayes-optimal ist, wenn keine zusätzlichen Einschränkungen gelten.
- Doch bei statistischen Gerechtigkeitsbedingungen wie statistischer Parität oder Gleichberechtigten Chancen (Equalized Odds) reicht dieser Ansatz nicht mehr aus, weil ein…
In der überwachten Lernforschung ist die binäre Klassifikation anhand vorhergesagter Wahrscheinlichkeiten ein zentrales Problem. Traditionell wird dafür ein einziger Schwellenwert verwendet, der Bayes-optimal ist, wenn keine zusätzlichen Einschränkungen gelten. Doch bei statistischen Gerechtigkeitsbedingungen wie statistischer Parität oder Gleichberechtigten Chancen (Equalized Odds) reicht dieser Ansatz nicht mehr aus, weil ein einzelner Schwellenwert die jeweiligen Kriterien häufig verletzt.
Besonders die Bedingung der Suffizienz – die Forderung, dass die Vorhersagegenauigkeit (Positive Predictive Value) für alle Gruppen gleich sein muss – stellt ein zusätzliches Hindernis dar. Selbst wenn die Scores bereits perfekt gruppenkalibriert sind, führt das einfache Schwellenwertverfahren zu einer Verletzung der Vorhersageparität.
Die vorgestellte Arbeit liefert eine exakte Lösung für die optimale binäre (randomisierte) Klassifikation unter der Bedingung der Suffizienz, vorausgesetzt die Scores liegen in endlich vielen Gruppen vor. Durch eine geometrische Analyse der erreichbaren Paare aus Positive Predictive Value (PPV) und False Omission Rate (FOR) wird ein leicht umsetzbares Post‑Processing‑Verfahren entwickelt, das die optimale Klassifikatorin ausschließlich mit den gruppenkalibrierten Scores und der Gruppenzugehörigkeit bestimmt.
Da Suffizienz und Separation in der Regel nicht gleichzeitig erfüllt werden können, identifiziert die Studie zudem einen Klassifikator, der die Abweichung von Separation minimiert, während er die Suffizienz-Bedingung einhält. Dieser Ansatz kann ebenfalls mit dem vorgestellten Algorithmus erreicht werden und erzielt häufig eine Leistung, die dem theoretischen Optimum nahekommt.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Kontext ohne Glossar-Suche
Wenn du nach dieser Meldung weiterlernen willst
Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.