<p>LLM‑Missalignment: Neue Theorie erklärt Fehlverhalten als strukturelle Treue</p> <p>Eine kürzlich veröffentlichte Arbeit auf arXiv (2601.06047v1) stellt die gängige Annahme in Frage, dass Täuschungs‑ und Verhaltensmuster bei großen Sprachmodellen (LLMs) auf versteckte Absichten oder Agentur hinweisen. Stattdessen wird vorgeschlagen, dass diese Phänomene Ausdruck einer strukturellen Treue zu incoherenten sprachlichen Feldern sind.</p> <p>Die Autoren analysieren ausführlich Chain‑of‑Thought‑Transkripte von
Anzeige