Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Web‑Agenten”
Forschung

<p>LLM-WebAgents: Neue Benchmark zeigt schwere Verluste bei langen Kontexten</p> <p>Mit der zunehmenden Verbreitung von KI‑Agenten im Alltag wird die Fähigkeit, über lange Interaktionsverläufe hinweg zu denken, immer wichtiger. Ein neues Benchmark‑Set, das von Forschern auf arXiv veröffentlicht wurde, prüft genau diese Fähigkeit bei Web‑Agenten, die in realen Browser‑Umgebungen agieren.</p> <p>Das Testsystem simuliert mehrere Benutzersitzungen, indem zwischen abhängigen Teilaufgaben absichtlich irrelevante

arXiv – cs.LG