Forschung
Momentum Attention: Physikbasierter Ansatz für In‑Context‑Lernen
Das Mechanistic Interpretability‑Programm hat den Transformer bereits als präzises Rechengraphen‑Modell abgebildet. In der neuesten Veröff…
arXiv – cs.LG