EvoSkill: Automatisierte Entdeckung von Agentenfähigkeiten steigert KI-Leistung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

EvoSkill ist ein selbstlernendes Framework, das Agentenfähigkeiten automatisch entdeckt und verfeinert, indem es Fehleranalysen nutzt.

Das System analysiert Ausführungsfehler, schlägt neue Fähigkeiten vor oder bearbeitet bestehende, und speichert sie in strukturierten, wiederverwendbaren Ordnern.

Bei den Benchmarks OfficeQA und SealQA erzielte EvoSkill deutliche Verbesserungen: die Genauigkeit stieg bei OfficeQA um 7,3 % (von 60,6 % auf 67,9 %) und bei SealQA um 12,1 % (von 26,6 % auf 38,7 %).

Darüber hinaus zeigte sich, dass Fähigkeiten, die auf SealQA entwickelt wurden, ohne Anpassung auf BrowseComp übertragen werden konnten und die Genauigkeit um 5,3 % verbesserten.

Diese Ergebnisse unterstreichen, dass die Optimierung auf Fähigkeitsniveau die Leistungsfähigkeit von KI-Agenten nachhaltig steigern kann und einen vielversprechenden Weg für die Entwicklung spezialisierter, aber flexibler Problemlöser eröffnet.