PAACE: Neues Framework für effiziente Kontextverwaltung bei LLM-Agenten
Large Language Model (LLM)-Agenten werden zunehmend in komplexen, mehrstufigen Arbeitsabläufen eingesetzt, die Planung, Tool‑Nutzung, Reflexion und den Austausch mit externen Wissenssystemen umfassen. Diese Abläufe erzeugen schnell wachsende Kontexte, die sorgfältig gepflegt, transformiert und komprimiert werden müssen, um die Genauigkeit zu erhalten, die Aufmerksamkeit nicht zu streuen und die Rechenkosten zu senken.
Das neue Framework PAACE (Plan‑Aware Automated Context Engineering) adressiert diese Herausforderungen, indem es die sich entwickelnde Agentenzustände optimiert. PAACE nutzt ein Modell zur Vorhersage der Relevanz der nächsten k‑Aufgaben, analysiert die Struktur von Plänen, verfeinert Anweisungen gemeinsam und führt eine kompression durch, die die Funktionsweise des Agenten bewahrt.
PAACE besteht aus zwei Hauptkomponenten: PAACE‑Syn, einem groß angelegten Generator synthetischer Agenten‑Workflows mit schrittweiser Kompressionsüberwachung, und PAACE‑FT, einer Familie von komprimierten Modellen, die aus erfolgreichen Lehr‑Demonstrationen distilliert wurden. In umfangreichen Langzeit‑Benchmarks wie AppWorld, OfficeBench und 8‑Objective QA zeigte PAACE konsistente Verbesserungen der Agenten‑Genauigkeit bei gleichzeitig deutlich reduzierten Kontextlasten.
Beispielsweise erzielte PAACE bei AppWorld höhere Genauigkeit als alle Vergleichs‑Baselines, während es die Spitzen‑Kontextgröße und die kumulative Abhängigkeit senkte. Auf OfficeBench und bei mehrstufigen QA‑Aufgaben verbesserte PAACE sowohl die Genauigkeit als auch den F1‑Score, erzielte weniger Schritte, geringere Token‑Spitzen und reduzierte die Abhängigkeit von Aufmerksamkeitsmechanismen. Die distillierten PAACE‑FT‑Modelle behielten 97 % der Leistung des Lehr‑Modells bei, während sie die Inferenzkosten erheblich verringerten.