FlashAdventure: Benchmark für GUI-Agenten bei kompletten Story-Arcs
In der Welt der KI-gesteuerten Benutzeroberflächen zeigen große Sprachmodelle (LLMs) großes Potenzial, wenn sie mit grafischen Interfaces interagieren. Besonders spannend sind Videospiele, weil sie eine breite Palette a…