Forschung
RewardUQ: Einheitlicher Rahmen zur Unsicherheitsbewertung von Belohnungsmodellen
In der Welt der großen Sprachmodelle (LLMs) sind Belohnungsmodelle entscheidend, um die Systeme an menschliche Präferenzen anzupassen. Doch…
arXiv – cs.LG