Forschung
GAIA: Daten‑Flywheel für GUI‑Agenten – iterative Kritik verbessert Testzeit
Große Vision‑Language‑Modelle haben die Fähigkeiten von GUI‑Agenten beim Verstehen von Textanweisungen, der Analyse von Bildschirminhalten…
arXiv – cs.AI