Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Aktivierungen”
Forschung

Token‑basierte Analyse: Lernbasierte SAE‑Steuerung für Sprachmodelle In einer neuen Veröffentlichung auf arXiv wird ein innovatives Verfahren vorgestellt, das Sparse Autoencoder (SAE) nutzt, um die Aktivierungen von Sprachmodellen in interpretierbare Merkmale zu zerlegen. Während bisherige Ansätze lediglich zeigen, welche Merkmale aktiv werden, liefert die neue Methode an, welche Merkmale tatsächlich die Modellantworten verändern, wenn sie verstärkt werden. Das Verfahren, genannt Kontrollverstärkendes L

arXiv – cs.LG