GUI‑Eyes: Aktive visuelle Wahrnehmung steigert GUI‑Agenten um 44,8 % Genauigkeit
In der Welt der grafischen Benutzeroberflächen (GUI) haben Fortschritte in Vision‑Language‑Modellen (VLMs) und Reinforcement Learning (RL) die Automatisierung von GUIs vorangetrieben. Dennoch basieren die meisten besteh…