Fehler in Web-Agenten-Pipelines erkennen: Feingranulare Analyse liefert neue Erkenntnisse
Web‑Agenten, die auf großen Sprachmodellen basieren, sind in der Lage, komplexe, mehrstufige Aufgaben in dynamischen Webumgebungen selbstständig zu erledigen. In bisherigen Studien liegt der Fokus jedoch fast ausschließlich auf dem Gesamterfolg, während Zwischenfehler kaum berücksichtigt werden. Dadurch bleiben wichtige Fehlerursachen unentdeckt und die systematische Verbesserung der Agenten wird erschwert.