Forschung
<p>Forscher haben ein neues Verfahren namens Where to Steer (W2S) vorgestellt, das die Auswahl der Schicht für das Steering von großen Sprachmodellen (LLMs) an die jeweilige Eingabe anpasst. Durch diese Eingabe‑abhängige Steuerung wird die Modell‑Alignment deutlich verbessert.</p>
Steering‑Vektoren ermöglichen es, das Verhalten von LLMs während der Inferenz zu modulieren, indem die Repräsentationen des Modells in Rich…
arXiv – cs.LG