Preference Orchestrator: Prompt-bewusste Multi-Objektiv-Ausrichtung für LLMs
Große Sprachmodelle (LLMs) haben in den letzten Jahren beeindruckende Fortschritte in vielen NLP-Aufgaben erzielt. Doch die Herausforderung, diese Modelle gleichzeitig an unterschiedliche menschliche Präferenzen für mehrere Ziele anzupassen, bleibt ein zentrales Hindernis für den praktischen Einsatz.