Forschung
Neues Benchmark DEEPSYNTH prüft LLM-Agenten bei komplexer Informationssynthese
In der Welt der großen Sprachmodelle (LLM) gewinnen Agenten, die Werkzeuge wie Webbrowser, Code-Interpreter und Datenanalyse-Tools einsetze…
arXiv – cs.AI