TPS-Bench: Evaluating AI Agents' Tool Planning \& Scheduling Abilities in Compounding Tasks
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
LLMs zeigen keine Fortschritte bei Bayesian Optimization – Hybridansatz überzeugt
arXiv – cs.AI
•
AgentSHAP: Tool-Bedeutung von LLM-Agenten mit Monte-Carlo-Shapley-Werten
arXiv – cs.AI
•
WebOperator: Bäumeuche für autonome Web-Agenten mit sicherer Rückverfolgung
KDnuggets
•
7 Schritte zum Meistern von Agentic AI
arXiv – cs.LG
•
LLM-Agenten: Kleine Fehler, große Folgen – Neue Schutzmethode reduziert Ausfälle
arXiv – cs.AI
•
LLMs: Mehrsprachigkeit im Zero-Shot-Test mit italienischen Gesundheitsdaten