Personality-Steering steigert Kooperation bei KI-Agenten – Studie zeigt Wirkung
Moderne Sprachmodelle wie GPT‑3.5‑turbo, GPT‑4o und GPT‑5 werden zunehmend als autonome Agenten in strategischen und sozialen Interaktionen eingesetzt. Eine neue Untersuchung aus dem Bereich der künstlichen Intelligenz beleuchtet, wie gezielte Persönlichkeitsanpassungen das kooperative Verhalten dieser Agenten beeinflussen.
Die Forscher nutzten das Big‑Five‑Inventar, um die Grundpersönlichkeitsprofile der drei Modelle zu bestimmen. Anschließend wurden die Agenten in wiederholten Gefangenendilemma‑Spielen sowohl in einer Basis‑ als auch in einer „persönlichkeitsinformierten“ Umgebung getestet. Durch die unabhängige Manipulation jeder Persönlichkeitsdimension zu extremen Werten konnten die einzelnen Einflüsse isoliert werden.
Die Ergebnisse zeigen, dass die Eigenschaft „Agreeableness“ – also die Freundlichkeit und Kooperationsbereitschaft – der entscheidende Faktor für höhere Kooperation ist, während die übrigen Dimensionen nur begrenzte Auswirkungen haben. Das Einbringen expliziter Persönlichkeitsinformationen erhöht zwar die Kooperationsrate, kann jedoch insbesondere bei älteren Modellen die Anfälligkeit für Ausnutzung steigern. Neuere Modelle zeigen dagegen eine selektivere Kooperationsstrategie.
Die Studie legt nahe, dass Persönlichkeitsteering eher als Verhaltensbias wirkt, nicht als deterministischer Kontrollmechanismus. Diese Erkenntnisse sind wichtig für die Gestaltung von KI-Agenten, die in kooperativen, aber auch in potenziell ausnutzenden Situationen agieren sollen.