GAIA: Daten‑Flywheel für GUI‑Agenten – iterative Kritik verbessert Testzeit
Große Vision‑Language‑Modelle haben die Fähigkeiten von GUI‑Agenten beim Verstehen von Textanweisungen, der Analyse von Bildschirminhalten und der Ausführung von Aufgaben stark erweitert. Dennoch bleibt ein kritisches Problem bestehen: einmalige Fehlaktionen können zu katastrophalen Abweichungen führen, weil Agenten ihre Handlungen nicht rückgängig machen können. Das neue System GAIA (GUI Action Critic’s Data Flywheel) löst dieses Problem, indem es Agenten iterative Kritikfähigkeiten verleiht, die die Test‑Time‑Scaling (TTS) ihrer Leistung deutlich verbessern.