CARD: Clusterbasierte Anpassung für personalisierte Textgenerierung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Das neue Framework CARD (Cluster-level Adaptation with Reward-guided Decoding) löst ein langjähriges Problem in der KI: große Sprachmodelle sollen sich individuell an Nutzer anpassen, ohne dass die Skalierbarkeit leidet. CARD erreicht dies durch eine mehrstufige, hierarchische Vorgehensweise.

Zunächst werden Nutzer anhand gemeinsamer stilistischer Muster in Cluster eingeteilt. Für jedes Cluster werden LoRA‑Adapter trainiert, die das Basismodell leicht modifizieren. Diese Cluster‑Adapter ermöglichen eine robuste Generalisierung und liefern zudem starke Leistungen bei begrenzten Datenmengen.

Um die feinen Unterschiede einzelner Nutzer zu erfassen, nutzt CARD einen impliziten Präferenzlernmechanismus. Dabei werden vom Nutzer verfasste Texte mit generierten Cluster‑Texten kontrastiert, sodass das Modell die individuellen Stilpräferenzen ohne manuelle Annotation ableiten kann.

Während der Inferenz erfolgt die Personalisierung ausschließlich im Decoding‑Schritt. CARD fügt leichtgewichtige Präferenzvektoren und niedrigrangige Logit‑Korrekturen ein, während das Basismodell unverändert bleibt. So bleibt die Modellgröße klein und die Berechnungen effizient.

In Experimenten auf den Benchmarks LaMP und LongLaMP übertrifft CARD die führenden Baselines in der Textqualität und bietet gleichzeitig erhebliche Verbesserungen in Effizienz und Skalierbarkeit – ein wichtiger Schritt für die praktische Umsetzung personalisierter Textgenerierung.

Ähnliche Artikel