ECLIPTICA: Dynamische LLM-Alignment mit CITA – Neue Flexibilität im Einsatz
Die Anpassung großer Sprachmodelle bleibt bislang weitgehend festgelegt: nach dem Training ist die Policy eingefroren und kann nur über Prompt-Hacks oder aufwändige Neujustierungen beeinflusst werden. Mit dem neuen Framework ECLIPTICA wird Alignment zu einer auf Anweisungen basierenden, zur Laufzeit steuerbaren Komponente. Natürliche Sprachanweisungen fungieren dabei als explizite Verhaltensverträge, die Parameter wie Haltung, Ablehnungsgrenzen oder Wortlaut unmittelbar anpassen.