BioPro: Zielgerichtete Geschlechtergerechtigkeit für Vision‑Language‑Modelle

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Vision‑Language‑Modelle (VLMs) übernehmen aus ihren Trainingsdaten stark ausgeprägte soziale Vorurteile, insbesondere in Bezug auf die Geschlechterdarstellung. Diese Verzerrungen wirken sich negativ auf Bildbeschreibungen und Text‑zu‑Bild‑Generierung aus und können zu diskriminierenden Ergebnissen führen.

Derzeitige Fairness‑Interventionen verfolgen meist einen „difference‑unaware“-Ansatz, bei dem allen Bevölkerungsgruppen gleichermaßen gleiche Regeln auferlegt werden. Solche Methoden unterscheiden nicht zwischen neutralen Kontexten, in denen Neutralität gewünscht ist, und expliziten Situationen, in denen geschlechtsspezifische Merkmale legitim und erhalten bleiben sollten.

BioPro (Bias Orthogonal Projection) erweitert das Konzept der difference‑aware Fairness auf multimodale Modelle. Durch die Analyse von kontrafaktischen Einbettungen identifiziert BioPro ein niedrigdimensionales Geschlechter‑Variations­subspace. Anschließend wird eine Projektion angewendet, die geschlechtsspezifische Informationen in neutralen Kontexten selektiv neutralisiert, während sie in expliziten Kontexten erhalten bleibt. Der Ansatz ist komplett training‑frei und lässt sich leicht in bestehende Pipelines integrieren.

Experimentelle Ergebnisse zeigen, dass BioPro die Geschlechter‑Bias‑Rate in neutralen Fällen deutlich senkt, ohne die Geschlechter‑Treue in expliziten Beschreibungen zu beeinträchtigen. Darüber hinaus demonstriert die Methode ihre Vielseitigkeit, indem sie in verschiedenen Anwendungsfällen erfolgreich eingesetzt werden kann.

Ähnliche Artikel