GUI-360: Riesiges Datenset für Computer‑Using Agents – neue Benchmark
In einer bedeutenden Veröffentlichung präsentiert das Forschungsteam das Datenset GUI‑360$^\circ$, das über 1,2 Millionen ausgeführte Aktionsschritte in realen Windows‑Office‑Anwendungen enthält. Jede Trajektorie wird mit hochauflösenden Screenshots, Zugänglichkeits‑Metadaten, klar definierten Zielen und detaillierten Zwischenschritten dokumentiert – sowohl erfolgreiche als auch fehlgeschlagene Aktionen.