Pluralistische Werte im LLM-Alignment: Sicherheit, Inklusivität & Modellverhalten
In einer Zeit, in der große Sprachmodelle (LLMs) zunehmend mit menschlichem Feedback trainiert werden, um sicherer und wertorientierter zu agieren, bleibt die soziale Vielfalt oft unberücksichtigt. Eine neue Studie unte…