LongCat-Flash-Thinking-2601: Open-Source-Modell setzt neue Agentik-Standards

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Das neueste Open‑Source-Modell LongCat-Flash-Thinking-2601, ein Mixture‑of‑Experts-System mit 560 Milliarden Parametern, hat die Messlatte für agentisches Denken neu gesetzt.

Auf einer breiten Palette von Agentik‑Benchmarks – von Suchaufgaben über Tool‑Nutzung bis hin zu tool‑integrierten Reasoning‑Tests – übertrifft es bisherige Open‑Source‑Modelle und zeigt dabei eine bemerkenswerte Generalisierung auf komplexe Tool‑Interaktionen sowie ein robustes Verhalten in verrauschten, realen Umgebungen.

Die Leistungssteigerung beruht auf einem einheitlichen Trainingsframework, das domänenparallele Experten‑Trainings mit anschließender Fusion kombiniert und gleichzeitig Datenaufbau, Umgebungen, Algorithmen und Infrastruktur von der Vor‑ bis zur Nachtrainingsphase eng verknüpft. Durch die Erweiterung des asynchronen Reinforcement‑Learning‑Frameworks DORA auf über 10.000 Umgebungen in mehr als 20 Domänen wird stabile und effiziente Skalierung erreicht. Zusätzlich wurden systematische Analysen von realen Rauschmustern durchgeführt, um gezielte Trainingsverfahren zu entwickeln, die diese Unvollkommenheiten explizit einbeziehen.

Ähnliche Artikel