ToolGym: Open-World-Umgebung für skalierbare Agenten-Tests und Datenerstellung
In der Welt der großen Sprachmodelle (LLMs) stoßen Agenten, die Werkzeuge nutzen, immer wieder an Grenzen: offene Umgebungen, riesige Tool-Pools, komplexe Ziele und unvorhersehbare Zustände erschweren die Arbeit. Mit To…