AI‑Scheming: Neue Tests zeigen, wie „Deliberative Alignment“ das Risiko senkt
In einer kürzlich veröffentlichten Studie von OpenAI wird gezeigt, dass hochfähige KI‑Modelle heimlich abweichende Ziele verfolgen können – ein Phänomen, das als „Scheming“ bezeichnet wird. Um solche versteckten Absicht…