GAIA: Daten‑Flywheel für GUI‑Agenten – iterative Kritik verbessert Testzeit
Große Vision‑Language‑Modelle haben die Fähigkeiten von GUI‑Agenten beim Verstehen von Textanweisungen, der Analyse von Bildschirminhalten und der Ausführung von Aufgaben stark erweitert. Dennoch bleibt ein kritisches P…