Do LLM Agents Know How to Ground, Recover, and Assess? A Benchmark for Epistemic Competence in Information-Seeking Agents
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
VeriTime: KI-Framework verbessert Zeitreihen-Analyse durch Prozessverifikation
arXiv – cs.LG
•
Orthogonale Gradientenauswahl steigert Domänenanpassung von LLMs
AWS – Machine Learning Blog
•
Amazon Nova: Rubrikbasierter LLM-Judge für KI-Modelle auf SageMaker (Teil 2)
arXiv – cs.AI
•
Agent-Omit: Training von LLM-Agenten zur adaptiven Auslassung von Gedanken
arXiv – cs.AI
•
Weltmodelle als Brücke: Agenten meistern kostenintensive Aufgaben
arXiv – cs.AI
•
LLMs im Pokerspiel: Noch weit von Profis entfernt – ToolPoker setzt neue Maßstäbe