Forschung
Sprachmodelle lernen aus Nutzerinteraktionen: Alignment und Personalisierung
Mehrere Dialogschritte mit Nutzern stellen die reichste Quelle an Daten dar, die Sprachmodelle erzeugen. Trotz ihrer Fülle werden sie häufi…
arXiv – cs.AI