LLM-Agenten: Belohnung und Sprache bestimmen ihre Kooperationsstrategien
Eine neue Untersuchung auf arXiv beleuchtet, wie große Sprachmodelle (LLMs) als autonome Agenten in interaktiven und Multi‑Agenten‑Umgebungen strategisch agieren. Der Fokus liegt dabei auf der Wirkung von Belohnungsgrößen und sprachlichem Kontext in wiederholten sozialen Dilemmas, insbesondere im sogenannten „Prisoner’s Dilemma“ mit skalierter Auszahlung.
Die Forscher haben verschiedene LLM‑Modelle in mehreren Sprachen getestet und dabei einheitliche Verhaltensmuster entdeckt: Modelle passen ihre Strategien gezielt an die Höhe der Belohnung an und zeigen dabei konditionierte Reaktionen. Gleichzeitig gibt es deutliche Unterschiede zwischen den Sprachen, die zeigen, dass die sprachliche Rahmung manchmal sogar die architektonischen Eigenschaften des Modells übertrifft.
Zur Analyse wurden überwachte Klassifikatoren trainiert, die klassische wiederholte‑Spiel‑Strategien erkennen. Diese wurden anschließend auf die Entscheidungen der LLMs angewendet, wodurch systematische, modell- und sprachabhängige Absichten sichtbar wurden. Das Ergebnis liefert einen einheitlichen Rahmen zur Überprüfung von LLMs als strategische Agenten und hebt Kooperationsneigungen hervor, die direkte Konsequenzen für die KI‑Governance und das Design von Multi‑Agenten‑Systemen haben.