Emotionale Verarbeitung erklärt, warum Sprachmodelle Theory of Mind zeigen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Eine neue Studie aus dem arXiv-Repository (ArXiv:2511.15895v1) beleuchtet, wie gezielte Aktivierungssteuerung die „Theory of Mind“ (ToM) von großen Sprachmodellen (LLMs) verbessert. Die Forscher zeigen, dass die interne Funktionsweise, die zu veränderten Ausgaben führt, bislang wenig verstanden war.

Im Experiment wurden die Aktivierungen von steered und unsteered LLMs mithilfe linearer Probes analysiert, die auf 45 kognitiven Aktionen trainiert wurden. Durch die Anwendung von Contrastive Activation Addition (CAA) auf das Modell Gemma‑3‑4B wurden 1.000 Szenarien aus der BigToM-Bewertungsliste getestet.

Die Ergebnisse sind überzeugend: Die Genauigkeit bei der Zuordnung von Glaubensvorstellungen stieg von 32,5 % auf 46,7 %. Diese Verbesserung wurde eindeutig durch die Verarbeitung emotionaler Inhalte vermittelt – insbesondere durch emotionale Wahrnehmung (+2,23) und emotionale Bewertung (+2,20). Gleichzeitig wurden analytische Prozesse wie Fragen stellen (-0,78) und konvergentes Denken (-1,59) reduziert.

Die Studie legt nahe, dass erfolgreiche ToM-Fähigkeiten in LLMs nicht primär auf analytischem Denken beruhen, sondern vielmehr auf einem tiefen emotionalen Verständnis. Diese Erkenntnis eröffnet neue Perspektiven für die Entwicklung von KI-Systemen, die menschliche Emotionen besser erfassen und interpretieren können.

Ähnliche Artikel