Gelato-30B-A3B: Das führende Grounding-Modell für GUI-Computeraufgaben
Wie kann man KI-Agenten zuverlässig beibringen, genau das richtige Bildschirmobjekt zu finden und anzuklicken, wenn man ihnen eine einfache Anweisung gibt? Ein Forschungsteam von ML Foundations hat die Antwort mit Gelato-30B-A3B geliefert – einem hochmodernen Grounding-Modell für grafische Benutzeroberflächen, das speziell dafür entwickelt wurde, in Computer‑Verwendung-Agenten integriert zu werden.