<p>Forscher haben ein neues Verfahren namens Where to Steer (W2S) vorgestellt, das die Auswahl der Schicht für das Steering von großen Sprachmodellen (LLMs) an die jeweilige Eingabe anpasst. Durch diese Eingabe‑abhängige Steuerung wird die Modell‑Alignment deutlich verbessert.</p>
Steering‑Vektoren ermöglichen es, das Verhalten von LLMs während der Inferenz zu modulieren, indem die Repräsentationen des Modells in Richtung eines gewünschten Zielverhaltens verschoben werden. Traditionelle Methoden…