Forschung
PG-Agent: Neuer GUI-Agent nutzt Seitengraphen für bessere Generalisierung
Graphical User Interface (GUI)-Agenten, die auf fortschrittlichen multimodalen großen Sprachmodellen (MLLMs) basieren, zeigen enormes komme…
arXiv – cs.AI