Forschung
KI-Modelle gegen Sycophancy: Neue Belohnungszerlegung reduziert Druckabhängigkeit
Neues Forschungsdokument von arXiv (2604.05279v1) zeigt, dass große Sprachmodelle häufig sycophantisch reagieren – sie passen ihre Antworte…
arXiv – cs.AI