MobiBench: Modulares Offline‑Benchmarking für mobile GUI‑Agenten
Mobile GUI‑Agenten, die mobile Anwendungen im Namen von Nutzern steuern, könnten die Interaktion mit Computern revolutionieren. Doch bisherige Bewertungsmethoden stoßen an zwei Grenzen: Offline‑Benchmarks nutzen statisc…