Forschung
Neues Bewertungsframework DREAM verbessert Bewertung von Deep Research Agents
Deep‑Research‑Agents können mittlerweile Berichte auf Analysten‑Niveau erstellen, doch ihre Bewertung bleibt schwierig, weil es keine einde…
arXiv – cs.AI