PerfGuard: Agent für visuelle Inhalte, der Tool-Performance berücksichtigt

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Mit dem Aufkommen leistungsstarker Large Language Models (LLMs) haben Agenten die Möglichkeit, Aufgaben durch logisches Denken und gezielte Tool-Aufrufe selbstständig zu erledigen. Doch bisher gehen viele Systeme davon aus, dass jedes Tool immer fehlerfrei funktioniert – ein Ansatz, der besonders bei der Generierung visueller Inhalte (AIGC) zu Unsicherheiten führt, weil die Leistung der eingesetzten Werkzeuge stark variieren kann.

PerfGuard löst dieses Problem, indem es die Performance jedes Tools systematisch erfasst und in die Planung einbezieht. Das Framework nutzt drei zentrale Mechanismen: Performance‑Aware Selection Modeling (PASM) ersetzt allgemeine Tool‑Beschreibungen durch ein mehrdimensionales Bewertungssystem, Adaptive Preference Update (APU) vergleicht theoretische Ranglisten mit den tatsächlichen Ergebnissen und passt die Tool‑Auswahl dynamisch an, und Capability‑Aligned Planning Optimization (CAPO) sorgt dafür, dass die erstellten Teilaufgaben exakt auf die erkannten Leistungsprofile abgestimmt sind.

In umfangreichen Tests übertrifft PerfGuard aktuelle Methoden deutlich. Die Agenten wählen nicht nur die passenden Tools mit höherer Genauigkeit, sondern führen die Aufgaben auch zuverlässiger aus und bleiben dabei konsequent im Einklang mit den Nutzerwünschen. Damit demonstriert PerfGuard, dass ein bewusster Umgang mit Tool‑Performance entscheidend für die Qualität und Zuverlässigkeit von automatisierten visuellen Inhalten ist.

Ähnliche Artikel