PARC: Selbstreflektierender Coding-Agent für autonome, robuste Langzeitaufgaben

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Der neue Agent PARC, vorgestellt auf arXiv, ermöglicht die autonome und robuste Durchführung von langwierigen Rechenaufgaben. Durch eine hierarchische Multi-Agenten-Architektur kombiniert PARC Planung, Ausführung und eine eigenständige Bewertung seiner eigenen Aktionen. Diese Selbstbewertung liefert Feedback, das strategische Fehler erkennt und korrigiert, sodass der Agent ohne menschliche Eingriffe weiter voranschreitet.

In der Materialwissenschaft reproduziert PARC eigenständig zentrale Ergebnisse zu Lithium-Ionen‑Konduktion und Legierungssegregation. Dabei koordiniert er Dutzende paralleler Simulationsaufgaben, die jeweils rund 43 Stunden dauern, und übernimmt die komplette Orchestrierung, Überwachung und Fehlerbehebung. In Kaggle‑basierten Experimenten löst PARC Datenanalysen und Suchstrategien aus minimalen Sprachbefehlen und erzielt dabei Lösungen, die mit von Menschen entwickelten Baselines konkurrieren.

Die Ergebnisse zeigen, dass die Kombination aus hierarchischer Multi-Agenten-Struktur, Selbstbewertung und Selbstfeedback die Grundlage für KI‑Systeme bildet, die eigenständig große wissenschaftliche und analytische Projekte durchführen können. PARC demonstriert damit das Potenzial, komplexe, langfristige Aufgaben ohne externe Kontrolle zuverlässig zu bewältigen.

Ähnliche Artikel