DPO steuert Verhalten, nicht Glaubenshaltungen – Ein Blick hinter die Kulissen
Direct Preference Optimization (DPO) gilt als Standardverfahren, um große Sprachmodelle an menschliche Präferenzen anzupassen. Doch bislang war unklar, welche tiefgreifenden Veränderungen DPO im Netzwerk bewirkt. Die ne…