Forschung
UpBench: Dynamisches Labor-Markt-Benchmark für KI-Agenten aus realen Upwork-Jobs
Mit UpBench erhält die Forschung ein neues, dynamisches Werkzeug, um die Leistungsfähigkeit von KI-Agenten in echten Arbeitsumgebungen zu m…
arXiv – cs.AI