KI News: Kurz und klar.

Anmelden

TPS-Bench: Evaluating AI Agents' Tool Planning \& Scheduling Abilities in Compounding Tasks

arXiv – cs.AI • 05.11.2025 05:00 • Original

#LLM-Agenten #Werkzeugplanung #Werkzeugscheduling #TPS-Bench #MCP-Tools #komplexe Aufgaben #Open-Source-LLM #Closed-Source-LLM

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 29.09.2025 05:00

LLMs zeigen keine Fortschritte bei Bayesian Optimization – Hybridansatz überzeugt

arXiv – cs.AI • 19.01.2026 05:00

AstroReason-Bench: Testet Agentenplanung in komplexen Raumfahrtproblemen

arXiv – cs.AI • 15.01.2026 05:00

MAXS: Meta-adaptive Exploration verbessert LLM-Agenten bei Tool-Integration

arXiv – cs.AI • 09.01.2026 05:00

XGrammar 2: Schnellere, dynamische Strukturgenerierung für Agenten-LLMs

arXiv – cs.LG • 22.12.2025 05:00

Turn-PPO: Neue Turn-Level-Strategie verbessert Multi-Turn RL in LLM-Agenten

arXiv – cs.AI • 22.12.2025 05:00

PAACE: Neues Framework für effiziente Kontextverwaltung bei LLM-Agenten