Forschung
ADAPT: Hybrid‑Ansatz zur Feature‑Visualisierung in LLMs
Die Analyse, welche Merkmale von Lernrichtungen im Aktivierungsraum großer Sprachmodelle (LLMs) codiert werden, erfordert die Identifikatio…
arXiv – cs.LG