Forschung arXiv – cs.AI

Chain-of-Agents: Neues Paradigma für end-to-end Problemlösung mit LLMs

In den letzten Jahren haben große Sprachmodelle (LLMs) und Multi‑Agenten-Systeme beeindruckende Fortschritte bei komplexen Aufgaben wie tiefgreifender Forschung, Vibe‑Coding und mathematischem Denken erzielt. Dennoch ba…

≈1 Min. Lesezeit Originalquelle
Kernaussagen
Das nimmst du aus dem Beitrag mit
  • In den letzten Jahren haben große Sprachmodelle (LLMs) und Multi‑Agenten-Systeme beeindruckende Fortschritte bei komplexen Aufgaben wie tiefgreifender Forschung, Vibe‑Co…
  • Dennoch basieren die meisten bestehenden Multi‑Agenten‑Ansätze auf manueller Prompt‑ und Workflow‑Engineering, was sie rechenintensiv, weniger leistungsfähig und nicht d…
  • Die Autoren stellen Kette von Agenten (CoA) vor – ein neues Paradigma, das die Vorteile eines Multi‑Agenten‑Systems in einem einzigen Modell vereint.

In den letzten Jahren haben große Sprachmodelle (LLMs) und Multi‑Agenten-Systeme beeindruckende Fortschritte bei komplexen Aufgaben wie tiefgreifender Forschung, Vibe‑Coding und mathematischem Denken erzielt. Dennoch basieren die meisten bestehenden Multi‑Agenten‑Ansätze auf manueller Prompt‑ und Workflow‑Engineering, was sie rechenintensiv, weniger leistungsfähig und nicht datenzentriert macht.

Die Autoren stellen Kette von Agenten (CoA) vor – ein neues Paradigma, das die Vorteile eines Multi‑Agenten‑Systems in einem einzigen Modell vereint. CoA aktiviert dynamisch verschiedene Tool‑Agenten und Rollen‑Agenten, um die Zusammenarbeit mehrerer Agenten in einer End‑zu‑End‑Problemlösung zu simulieren. Dadurch wird die Komplexität von Aufgaben ohne zusätzliche externe Frameworks bewältigt.

Um die End‑zu‑End‑Fähigkeiten zu trainieren, nutzen die Forscher ein Multi‑Agenten‑Distillations‑Framework, das die besten Multi‑Agenten‑Systeme in CoA‑Trajektorien überführt und für ein überwährendes Feintuning verwendet. Anschließend wird agentenbasiertes Verstärkungslernen auf verifizierbaren Aufgaben eingesetzt, um die Leistung weiter zu steigern. Die daraus resultierenden Modelle werden Agenten‑Grundlagenmodelle (AFMs) genannt.

Empirische Studien zeigen, dass AFMs neue Spitzenleistungen in einer Vielzahl von Benchmarks erzielen – sowohl im Web‑Agenten‑ als auch im Code‑Agenten‑Umfeld. Die komplette Forschung, einschließlich der Modelle und Trainingsdaten, ist öffentlich zugänglich, was die Weiterentwicklung und Anwendung von Kette von Agenten in der Praxis erleichtert.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

LLMs sind Sprachmodelle, die Text verstehen, erzeugen und in Produkte eingebettet werden.

Achte zuerst auf Modellqualitaet, Kosten pro Nutzung und darauf, ob echte Produktverbesserungen oder nur Benchmarks kommuniziert werden.

Welches konkrete Problem loest das Modell besser als bisher?
Was bedeutet die Neuerung fuer Geschwindigkeit, Kosten oder Zuverlaessigkeit?
Was veraendert sich praktisch?
Begriffe zum Einordnen

Kontext ohne Glossar-Suche

LLM
LLMs sind Sprachmodelle, die Text verstehen, erzeugen und in Produkte eingebettet werden.
Multi-Agenten-Systeme
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
CoA
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
arXiv – cs.AI
Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.
Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen