Forschung
Universelle Aktivierungsrichtungen enthüllen PII-Leckage in Sprachmodellen
Moderne Sprachmodelle besitzen ein komplexes internes Gefüge, doch bislang ist kaum bekannt, wie sensible Verhaltensweisen wie die Leckage…
arXiv – cs.LG