Forschung
FlashAdventure: Benchmark für GUI-Agenten bei kompletten Story-Arcs
In der Welt der KI-gesteuerten Benutzeroberflächen zeigen große Sprachmodelle (LLMs) großes Potenzial, wenn sie mit grafischen Interfaces i…
arXiv – cs.AI