Do LLM Agents Know How to Ground, Recover, and Assess? A Benchmark for Epistemic Competence in Information-Seeking Agents
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
Neues Lernverfahren steigert KI‑Vorhersagen um 27 % – ohne Echtzeit‑Labels
arXiv – cs.AI
•
KI-Agent KP-Agent steigert SSA-Kampagnen um 49 % durch Keyword‑Pruning
arXiv – cs.AI
•
Datenlernen in LLMs führt zum Kollaps – Symbolische Modelle sind entscheidend
arXiv – cs.AI
•
WildSci: Neue Datenbank für wissenschaftliches LLM‑Reasoning
arXiv – cs.LG
•
MaxCode: KI-Framework steigert Code-Optimierung um bis zu 20 %
arXiv – cs.LG
•
LLM-Training neu: Selbstkorrigierende, lange Denkketten steigern Matheleistung