Personality‑Slider für LLMs: Steuerung von Charaktereigenschaften in Echtzeit

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Eine neue Technik ermöglicht es, große Sprachmodelle (LLMs) in Echtzeit mit individuellen Persönlichkeiten zu versehen, ohne dass dafür umfangreiches Fine‑Tuning oder Reinforcement‑Learning‑Methoden nötig sind. Stattdessen werden sogenannte „Personality‑Slider“ eingesetzt, die die gewünschten Eigenschaften direkt während der Inferenz steuern.

Traditionell erfordert die Anpassung eines LLMs an eine bestimmte Persona aufwendiges Supervised Fine‑Tuning (SFT) oder RLHF. Diese Verfahren sind kostenintensiv, monolithisch und führen dazu, dass für jede Zielpersönlichkeit ein komplett neues Modell trainiert werden muss. Die neue Methode nutzt stattdessen inference‑time steering, wobei die Steuerungsvektoren so gestaltet werden, dass sie sich nicht gegenseitig stören.

Der Schlüssel liegt im sogenannten Sequential Adaptive Steering (SAS). Dabei werden die Steuerungsvektoren nacheinander auf die verbleibende Residual‑Strömung trainiert, die bereits durch frühere Interventionen verändert wurde. Durch diese Orthogonalisation werden die Vektoren zu wiederverwendbaren Bausteinen, die mit einfachen Koeffizienten (alpha) kombiniert werden können, um komplexe, hochpräzise Persönlichkeitsprofile zu erzeugen.

Die Autoren haben das System auf die Big‑Five‑Persönlichkeitsmerkmale getestet und konnten zeigen, dass SAS sowohl die Zielerreichung als auch die Kohärenz der generierten Texte deutlich verbessert, verglichen mit naiven Baselines. Dabei bleibt das Modell selbst unverändert – die Anpassung erfolgt ausschließlich über die Slider, was die Methode äußerst effizient und flexibel macht.

Ähnliche Artikel