ToolMind: 160.000 hochwertige Tool‑Use-Daten für LLM‑Agenten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In den letzten Jahren haben sich Sprachmodelle (LLMs) rasant weiterentwickelt, um komplexe Aufgaben mithilfe externer Werkzeuge zu lösen. Ein entscheidendes Hindernis bleibt jedoch die begrenzte Verfügbarkeit von qualitativ hochwertigen Interaktionspfaden, die für das Training leistungsfähiger Agenten unerlässlich sind.

Mit dem neuen ToolMind-Datensatz liefert die Forschung ein umfangreiches, 160.000‑Stichproben‑Korpus, der aus über 20.000 verschiedenen Tools und 200.000 ergänzenden Open‑Source‑Daten besteht. Der Aufbau erfolgt zunächst über ein Funktionsgraphen‑Modell, das Parameterkorrelationen abbildet, bevor ein Multi‑Agenten‑Framework realistische Nutzer‑Assistent‑Tool‑Interaktionen simuliert.

Ein besonderes Merkmal von ToolMind ist die feingranulare, turn‑basierte Qualitätskontrolle. Durch gezieltes Filtern werden fehlerhafte oder suboptimale Schritte entfernt, sodass ausschließlich präzise, nachvollziehbare Reasoning‑Spuren im Datensatz verbleiben. Diese Vorgehensweise verhindert die Verstärkung von Fehlern während des Trainings und bewahrt gleichzeitig selbstkorrigierende Denkprozesse, die für robustes Tool‑Use‑Learning entscheidend sind.

Modellvarianten, die auf ToolMind feinabgestimmt wurden, zeigen signifikante Leistungssteigerungen gegenüber Standard‑Baselines auf mehreren Benchmark‑Tests. Der Datensatz stellt damit einen wichtigen Schritt dar, um LLM‑Agenten zu verlässlicheren und effizienteren Werkzeuganwendern zu machen.

Ähnliche Artikel