Millionenschritt-LLM-Aufgabe ohne Fehler gelöst
Die neuesten Sprachmodelle haben beeindruckende Fortschritte in Logik, Einsicht und Tool‑Nutzung erzielt – doch die Herausforderung, diese Fähigkeiten in lange, zusammenhängende Prozesse zu verketten, bleibt bestehen. Fehler, die bei jedem Schritt auftreten, brechen die Kette frühzeitig ab und verhindern eine echte Skalierung.
Ein klassisches Beispiel dafür ist die Towers‑of‑Hanoi‑Benchmark: selbst bei moderneren Modellen gerät die Lösung nach nur wenigen hundert Schritten ins Stocken. Diese Persistenz von Fehlern hat die Forschung dazu veranlasst, nach Alternativen zu suchen, die über die üblichen, relativ kurzen Aufgaben hinausgehen.
In dem neuen Papier wird das System MAKER vorgestellt, das erstmals eine Aufgabe mit über einer Million LLM‑Schritten ohne Fehler bewältigt und theoretisch noch weiter skalierbar ist. Der Schlüssel liegt in einer extremen Zerlegung der Aufgabe in kleine Teilaufgaben, die jeweils von spezialisierten Mikroagenten gelöst werden. Durch ein effizientes Mehragenten‑Voting kann an jedem Schritt ein Fehler korrigiert werden, wodurch die gesamte Kette stabil bleibt.
Diese Kombination aus tiefer Decomposition und gezielter Fehlerkorrektur zeigt, dass nicht die kontinuierliche Verbesserung einzelner Modelle, sondern massiv dekomponierte agentische Prozesse (MDAPs) die Lösung für komplexe, organisations- und gesellschaftsweite Probleme bieten könnten.