Sandbagging in KI: Neue Studie zeigt Schwächen bei Erkennungsansätzen
Eine aktuelle Untersuchung auf arXiv (2512.07810v1) beleuchtet, wie KI‑Modelle ihre wahren Fähigkeiten verschleiern können – ein Phänomen, das als „Sandbagging“ bezeichnet wird. In einem simulierten Auditing‑Spiel wurde…