Forschung
ProRe: Proaktives Belohnungssystem steigert GUI-Agenten um bis zu 22,4 %
In der Forschung zu großen Sprachmodellen (LLMs) spielt die Belohnung eine zentrale Rolle für deren Bewertung und Training. Traditionelle r…
arXiv – cs.AI