Forschung
Transformers im geschlossenen Kreislauf: Iteratives Latent-Äquilibrium
Moderne autoregressive Transformer‑Modelle arbeiten bislang im „Open‑Loop“: jedes versteckte Zustandsvektor wird in einem einzigen Vorwärts…
arXiv – cs.LG