Gelato-30B-A3B: Das führende Grounding-Modell für GUI-Computeraufgaben
Wie kann man KI-Agenten zuverlässig beibringen, genau das richtige Bildschirmobjekt zu finden und anzuklicken, wenn man ihnen eine einfache Anweisung gibt? Ein Forschungsteam von ML Foundations hat die Antwort mit Gelat…