Neue Technik reduziert demografische Verzerrung in Gesichtserkennung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Gesichtserkennungssysteme zeigen häufig stark ausgeprägte demografische Verzerrungen, weil Informationen zu Geschlecht, Hautfarbe oder Alter eng mit den eigentlichen Identitätsmerkmalen verknüpft sind. Besonders in multikulturellen Städten, in denen biometrische Systeme Teil der Smart‑City-Infrastruktur sind, kann dies zu erheblichen Ungleichheiten bei der Verifikation führen.

Um diesem Problem entgegenzuwirken, stellt die Forschung die Methode „Unified Text‑Image Embedding“ (UTIE) vor. UTIE nutzt die Zero‑Shot‑Fähigkeiten von Vision‑Language‑Modellen (VLMs) und deren natürliche Ausrichtung von Bild- und Textrepräsentationen. Dabei werden die Gesichtsembeddings jeder demografischen Gruppe mit textbasierten Merkmalen aus anderen Gruppen angereichert. Das Ergebnis ist eine neutralere Darstellung, die weniger von demografischen Attributen beeinflusst wird und stattdessen stärker auf identitätsrelevante Features setzt.

Die Methode wurde mit drei führenden VLMs – CLIP, OpenCLIP und SigLIP – auf den Benchmarks RFW und BFW getestet, die speziell Verzerrungen in der Gesichtserkennung messen. Die Experimente zeigen, dass UTIE die Bias‑Messwerte konsequent senkt, während die Gesamtleistung gleich bleibt oder sogar leicht steigt. Damit bietet UTIE einen vielversprechenden Ansatz, um faire und zuverlässige Gesichtserkennung in heterogenen Gesellschaften zu ermöglichen.

Ähnliche Artikel