Neues Modell reduziert Bias in multimodalen RL‑Systemen
In der Verstärkungslern‑Forschung mit menschlichem Feedback (RLHF) können Belohnungsmodelle vorhandene Vorurteile in multimodalen Datensätzen verstärken. Das führt zu fehlerhaften Belohnungssignalen und einer geringer…