ProRe: Proaktives Belohnungssystem steigert GUI-Agenten um bis zu 22,4 %
In der Forschung zu großen Sprachmodellen (LLMs) spielt die Belohnung eine zentrale Rolle für deren Bewertung und Training. Traditionelle regelbasierte oder modellbasierte Ansätze stoßen jedoch bei GUI-Agenten an ihre G…