Forschung
Benchmark-Alignment für Sprachmodelle: Präferenzbasierte Bewertung
In einer wegweisenden Studie wird gezeigt, wie man die gängigen Leistungsbenchmarks von Sprachmodellen an echte Nutzerpräferenzen anpassen…
arXiv – cs.AI