Gelato-30B-A3B: Das führende Grounding-Modell für GUI-Computeraufgaben
Anzeige
Wie kann man KI-Agenten zuverlässig beibringen, genau das richtige Bildschirmobjekt zu finden und anzuklicken, wenn man ihnen eine einfache Anweisung gibt? Ein Forschungsteam von ML Foundations hat die Antwort mit Gelato-30B-A3B geliefert – einem hochmodernen Grounding-Modell für grafische Benutzeroberflächen, das speziell dafür entwickelt wurde, in Computer‑Verwendung-Agenten integriert zu werden.
Gelato-30B-A3B übertrifft bisherige Modelle wie GTA1-32B und setzt damit neue Maßstäbe für die Interaktion von KI mit GUIs. Durch seine fortschrittliche Architektur kann das Modell präzise auf die gewünschten Elemente im Bildschirm reagieren und damit die Zuverlässigkeit von KI‑gestützten Computeraufgaben deutlich steigern.
Ähnliche Artikel
The Register – Headlines
•
Microsoft kündigt AI-Agenten an, die als eigenständige Nutzer Unternehmen agieren
MarkTechPost
•
Anthropic optimiert MCP-Agenten: Code-First-System mit Code Execution
VentureBeat – AI
•
Terminal‑Bench 2.0 und Harbor: Neuer Standard für KI-Agenten in Containern
AWS – Machine Learning Blog
•
Amazon Bedrock Agenten verbinden mit Wissensdatenbanken über Konten hinweg
MarkTechPost
•
Google AI präsentiert ADK Go: Open-Source-Toolkit für Go-AI-Agenten
ZDNet – Artificial Intelligence
•
Microsoft-Studie zeigt: Nur ein KI-Agent widerstand Manipulationen