GTool: Graphbasierte Toolplanung mit großen Sprachmodellen
Die Planung von Werkzeugen mit großen Sprachmodellen (LLMs) soll die Lücke zwischen natürlicher Sprachverständnis und konkreter Aufgabenerfüllung schließen. Dabei geht es darum, die passenden Tools auszuwählen, zu organisieren und vorzubereiten, um eine Nutzeranfrage erfolgreich umzusetzen.
Aktuelle Ansätze behandeln die einzelnen Tools als isolierte Bausteine und nutzen die inhärenten Abhängigkeiten zwischen ihnen nicht aus. Das führt häufig zu unvollständigen oder sogar falschen Planungen, besonders wenn die Abhängigkeiten unvollständig dokumentiert sind und die Toolmenge groß ist.
GTool löst dieses Problem, indem es für jede Anfrage ein spezifisches Tool‑Graphenmodell erstellt. Durch die graphbasierte Darstellung können Tools effizient ausgewählt und die notwendigen Abhängigkeiten klar dargestellt werden. Zusätzlich wird ein Vorhersage‑Task für fehlende Abhängigkeiten integriert, der die Zuverlässigkeit von GTool bei unvollständigen Daten erhöht.
Ein großer Vorteil von GTool ist die nahtlose Integration in verschiedene LLM‑Backbones ohne umfangreiches Retraining. Das System kann also mit bestehenden Modellen wie einem 7‑Billionen‑Parameter‑LLM kombiniert werden.
Umfangreiche Experimente zeigen, dass GTool die Leistung im Vergleich zu aktuellen State‑of‑the‑Art‑Baselines um mehr als 29,6 % steigert – ein signifikanter Fortschritt in der Tool‑Planung mit großen Sprachmodellen.