MAVIS: Leichtgewichtiges Alignment für LLMs in Echtzeit
Moderne Sprachmodelle werden immer häufiger in Anwendungen eingesetzt, die gleichzeitig mehrere, oft widersprüchliche Ziele erfüllen müssen – etwa Hilfsbereitschaft, Sicherheit und Humor. Um die Ausgaben an die individu…