Forschung
LiveAgentBench: 104 reale Aufgaben testen KI-Agenten
Mit dem neuen Benchmark LiveAgentBench werden KI-Agenten unter realen Bedingungen geprüft. Die Plattform umfasst 104 Szenarien, die aus öff…
arXiv – cs.AI