Forschung
ECLIPTICA: Dynamische LLM-Alignment mit CITA – Neue Flexibilität im Einsatz
Die Anpassung großer Sprachmodelle bleibt bislang weitgehend festgelegt: nach dem Training ist die Policy eingefroren und kann nur über Pro…
arXiv – cs.LG