ResMAS: Optimierung der Resilienz in LLM-basierten Multi-Agenten-Systemen
Large‑Language‑Model‑basierte Multi‑Agenten‑Systeme (LLM‑MAS) haben in den letzten Jahren beeindruckende Leistungen in komplexen Aufgabenbereichen erzielt. Gleichzeitig sind sie, weil sie über mehrere Geräte und Umgebungen verteilt sind, anfällig für Störungen wie Agenten‑Ausfälle oder andere unerwartete Eingriffe.
Die bisherige Forschung konzentrierte sich überwiegend darauf, Angriffe erst nach ihrem Auftreten zu erkennen und zu mildern. Ein proaktiver Ansatz, der die Systeme von vornherein widerstandsfähiger macht, fehlt bislang.
In der vorliegenden Arbeit wurde die Resilienz von LLM‑MAS systematisch unter verschiedenen Störungen untersucht. Dabei zeigte sich, dass sowohl die Kommunikationstopologie als auch das Prompt‑Design entscheidende Einflussfaktoren auf die Widerstandsfähigkeit sind.
Auf dieser Basis wurde ResMAS entwickelt – ein zweistufiges Framework. Zunächst wird ein Belohnungsmodell trainiert, das die Resilienz eines Systems vorhersagen kann. Anschließend nutzt ein Topologie‑Generator, der auf Reinforcement‑Learning basiert, diese Vorhersage, um automatisch robuste Netzwerkstrukturen für spezifische Aufgaben zu erzeugen. In der zweiten Stufe wird ein topologie‑sensitives Prompt‑Optimierungsverfahren eingesetzt, das die Eingabeaufforderungen jedes Agenten an seine Verbindungen und Interaktionen anpasst.
Umfangreiche Experimente über eine Vielzahl von Aufgaben hinweg zeigen, dass ResMAS die Resilienz von LLM‑MAS unter unterschiedlichen Einschränkungen deutlich verbessert. Darüber hinaus demonstriert das Framework eine starke Generalisierungsfähigkeit auf neue Aufgaben und Modelle, was auf ein hohes Potenzial für die Entwicklung robuster Multi‑Agenten‑Systeme hindeutet.