PersonalAlign: Hierarchische Intent‑Ausrichtung für personalisierte GUI‑Agenten
In einer neuen Studie wird der Agent PersonalAlign vorgestellt, der sich auf die Ausrichtung von impliziten Nutzerintentionen konzentriert. Während herkömmliche GUI‑Agenten meist auf explizite Befehle reagieren, muss PersonalAlign aus langen Nutzeraufzeichnungen ableiten, welche Präferenzen bei vagen Anweisungen fehlen und welche Routinen der Nutzer im Alltag verfolgt. Dadurch kann der Agent nicht nur genauer ausgeführt, sondern auch proaktiv unterstützen.
Zur Messung dieser Fähigkeiten wurde das Benchmark‑Set AndroidIntent entwickelt. Es enthält 20.000 langfristige Nutzeraufzeichnungen, aus denen 775 individuelle Präferenzen und 215 Routinen annotiert wurden. Das Set prüft, ob Agenten in der Lage sind, unklare Anweisungen zu klären und sinnvolle Vorschläge zu machen, indem sie über die gesammelten Daten nachdenken.
Ein zentrales Element der Arbeit ist der Hierarchical Intent Memory Agent (HIM‑Agent). Dieser Agent pflegt ein ständig aktualisiertes persönliches Gedächtnis und ordnet Präferenzen sowie Routinen hierarchisch. In Tests zeigte sich, dass HIM‑Agent die Ausführungsleistung um 15,7 % und die proaktive Unterstützung um 7,3 % gegenüber Standardagenten verbessert.
Weitere Agenten wie GPT‑5, Qwen3‑VL und UI‑TARS wurden ebenfalls auf AndroidIntent evaluiert. Die Ergebnisse unterstreichen, dass die hierarchische Intent‑Ausrichtung und das persönliche Gedächtnis entscheidende Faktoren für die Effektivität von GUI‑Agenten in realen Einsatzszenarien sind.