Vision-basierte Bewertung steigert Zuverlässigkeit autonomer Computeragenten
Eine neue Studie auf arXiv zeigt, dass Computer Use Agents (CUAs) – Programme, die digitale Oberflächen selbstständig bedienen – häufig nicht zuverlässig erkennen, ob ein Auftrag abgeschlossen ist. Um dieses Problem zu…