Forschung
RepIt: Zielgerichtete Steuerung von Sprachmodellen durch isolierte Konzepte
In der Forschung zur Aktivierungssteuerung großer Sprachmodelle (LLMs) stoßen aktuelle Methoden häufig auf unerwünschte Nebeneffekte. Um di…
arXiv – cs.AI