KI News: Kurz und klar.

Anmelden

Do LLM Agents Know How to Ground, Recover, and Assess? A Benchmark for Epistemic Competence in Information-Seeking Agents

arXiv – cs.AI • 29.09.2025 05:00 • Original

#LLM #Reinforcement Learning #Open-Domain-FAQ #SeekBench #epistemische Kompetenz #Antwortspuren #Kalibrierung

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 10.02.2026 05:00

VeriTime: KI-Framework verbessert Zeitreihen-Analyse durch Prozessverifikation

arXiv – cs.LG • 09.02.2026 05:00

Orthogonale Gradientenauswahl steigert Domänenanpassung von LLMs

AWS – Machine Learning Blog • 06.02.2026 16:29

Amazon Nova: Rubrikbasierter LLM-Judge für KI-Modelle auf SageMaker (Teil 2)

arXiv – cs.AI • 05.02.2026 05:00

Agent-Omit: Training von LLM-Agenten zur adaptiven Auslassung von Gedanken

arXiv – cs.AI • 03.02.2026 05:00

Weltmodelle als Brücke: Agenten meistern kostenintensive Aufgaben

arXiv – cs.AI • 03.02.2026 05:00

LLMs im Pokerspiel: Noch weit von Profis entfernt – ToolPoker setzt neue Maßstäbe