Suche nach Web‑Agenten

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

Die Entwicklung von GUI-Agenten steht bislang vor zwei großen Hindernissen: Entweder greifen sie auf unsichere, nicht reproduzierbare Live-…

arXiv – cs.AI 06.03.2026 05:00

Forschung

TimeWarp: Web-Agenten gegen veränderte Web‑Designs testen

Die jüngste Veröffentlichung von TimeWarp stellt die Leistungsfähigkeit moderner Web‑Agenten auf die Probe, indem sie die sich ständig wand…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neues Benchmark BrowseComp‑V3 testet multimodale Web‑Agenten auf 300 Fragen

Die Forschung im Bereich multimodaler Sprachmodelle hat ein neues Maßstabsetzer-Tool vorgestellt: BrowseComp‑V3. Dieses Benchmark‑Set beste…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Automatisierte Datengenerierung und präzise Bewertung für Web-Agenten-Training

Ein neues Verfahren ermöglicht es, große Mengen hochwertiger Trainingsdaten für Web‑Agenten automatisch zu erzeugen. Dabei liegt der Fokus…

arXiv – cs.AI 16.02.2026 05:00

Forschung

WebClipper: Web-Agenten effizienter durch graphbasiertes Trajektorien‑Pruning

In der Welt der Web‑Agenten, die komplexe Informationsaufgaben lösen, bleibt die Sucheffizienz bislang wenig erforscht. Viele führende Open…

arXiv – cs.AI 16.02.2026 05:00

Forschung

EmeraldMind: KI-gestütztes Framework erkennt Greenwashing zuverlässig

Mit der zunehmenden Verbreitung von KI‑ und Web‑Agenten in Entscheidungsprozessen wird es immer wichtiger, intelligente Systeme zu entwicke…

arXiv – cs.AI 15.12.2025 05:00

Forschung

LLM-WebAgents: Neue Benchmark zeigt schwere Verluste bei langen Kontexten Mit der zunehmenden Verbreitung von KI‑Agenten im Alltag wird die Fähigkeit, über lange Interaktionsverläufe hinweg zu denken, immer wichtiger. Ein neues Benchmark‑Set, das von Forschern auf arXiv veröffentlicht wurde, prüft genau diese Fähigkeit bei Web‑Agenten, die in realen Browser‑Umgebungen agieren. Das Testsystem simuliert mehrere Benutzersitzungen, indem zwischen abhängigen Teilaufgaben absichtlich irrelevante

arXiv – cs.LG 05.12.2025 05:00

Forschung

Prune4Web: DOM-Pruning für effiziente Web-Agenten

Die Automatisierung von Web‑Interaktionen wird zunehmend von intelligenten Agenten getragen, die menschliche Aktionen nachahmen. Trotz der…

arXiv – cs.AI 27.11.2025 05:00

Forschung

Web-Agenten im Fokus: Energieverbrauch und CO₂‑Kosten werden gemessen

Neue Forschung beleuchtet die bislang wenig beachteten Nachhaltigkeitsaspekte von Web‑Agenten wie OpenAI’s Operator und Google’s Project Ma…

arXiv – cs.AI 07.11.2025 05:00

Forschung

Fehler in Web-Agenten-Pipelines erkennen: Feingranulare Analyse liefert neue Erkenntnisse

Web‑Agenten, die auf großen Sprachmodellen basieren, sind in der Lage, komplexe, mehrstufige Aufgaben in dynamischen Webumgebungen selbstst…

arXiv – cs.AI 19.09.2025 05:00

Forschung

Chain-of-Agents: Neues Paradigma für end-to-end Problemlösung mit LLMs

In den letzten Jahren haben große Sprachmodelle (LLMs) und Multi‑Agenten-Systeme beeindruckende Fortschritte bei komplexen Aufgaben wie tie…

arXiv – cs.AI 20.08.2025 05:00

Finde Modelle, Firmen und Themen

WebFactory: Automatisierte Kompression von Sprachmodellwissen zu Web-Agenten

TimeWarp: Web-Agenten gegen veränderte Web‑Designs testen

Neues Benchmark BrowseComp‑V3 testet multimodale Web‑Agenten auf 300 Fragen

Automatisierte Datengenerierung und präzise Bewertung für Web-Agenten-Training

WebClipper: Web-Agenten effizienter durch graphbasiertes Trajektorien‑Pruning

EmeraldMind: KI-gestütztes Framework erkennt Greenwashing zuverlässig

Prune4Web: DOM-Pruning für effiziente Web-Agenten

Web-Agenten im Fokus: Energieverbrauch und CO₂‑Kosten werden gemessen

Fehler in Web-Agenten-Pipelines erkennen: Feingranulare Analyse liefert neue Erkenntnisse

Chain-of-Agents: Neues Paradigma für end-to-end Problemlösung mit LLMs

🍪 Cookie-Einstellungen