Forschung
Pluralistische Werte im LLM-Alignment: Sicherheit, Inklusivität & Modellverhalten
In einer Zeit, in der große Sprachmodelle (LLMs) zunehmend mit menschlichem Feedback trainiert werden, um sicherer und wertorientierter zu…
arXiv – cs.AI