RAPTOR: Neue Ridge-Logistikprobe verbessert Konzept-Analyse in LLMs
Wissenschaftler haben einen neuen Ansatz namens RAPTOR (Ridge-Adaptive Logistic Probe) vorgestellt, der die Analyse von Konzepten in großen Sprachmodellen (LLMs) revolutioniert. Durch die Kombination einer L2-Regularisierung mit einer datengetriebenen Ridge-Stärke liefert RAPTOR präzise Konzeptvektoren, die sowohl genau als auch stabil gegenüber Ablation sind.