Sprachmodelle lernen aus Nutzerinteraktionen: Alignment und Personalisierung
Mehrere Dialogschritte mit Nutzern stellen die reichste Quelle an Daten dar, die Sprachmodelle erzeugen. Trotz ihrer Fülle werden sie häufig ignoriert, obwohl sie wertvolle Hinweise enthalten: Ein Folgeanfrage kann zeig…