RP-ReAct: Mehragenten-Ansatz steigert Zuverlässigkeit autonomer Agenten in Unternehmen
Autonome Agenten haben in den letzten Jahren große Fortschritte gemacht, doch komplexe Aufgaben in Unternehmensumgebungen bleiben eine Herausforderung. Insbesondere die Notwendigkeit, mehrere Werkzeuge zu koordinieren und unterschiedliche Datenquellen zu verarbeiten, führt zu Instabilität im Ablauf und zu einem schnellen Verbrauch des begrenzten Kontextfensters lokaler Open-Weight-Modelle.
Um diese Probleme zu lösen, präsentiert die neue Arbeit RP-ReAct (Reasoner Planner-ReAct). Der Ansatz trennt die strategische Planung von der niedrigen Ebene der Ausführung. Ein Reasoner Planner Agent (RPA) erstellt für jeden Unterschritt einen Plan und analysiert kontinuierlich die Ergebnisse mithilfe eines leistungsstarken Large Reasoning Models. Parallel agieren ein oder mehrere Proxy-Execution Agents (PEA), die die Plan-Schritte in konkrete Tool-Interaktionen umsetzen und dabei eine Kontext‑Speicher‑Strategie einsetzen, um das Überlaufen des Kontextfensters zu verhindern.
Die Autoren haben RP-ReAct anhand des ToolQA-Benchmarks getestet, der mehrere Domänen abdeckt, und dabei sechs Open-Weight-Reasoning-Modelle verwendet. Die Ergebnisse zeigen, dass RP-ReAct die Leistung über aktuelle Baselines hinaus verbessert und die Generalisierungsfähigkeit bei vielfältigen Aufgaben deutlich erhöht.