Transformers im geschlossenen Kreislauf: Iteratives Latent-Äquilibrium
Moderne autoregressive Transformer‑Modelle arbeiten bislang im „Open‑Loop“: jedes versteckte Zustandsvektor wird in einem einzigen Vorwärtsschritt berechnet und anschließend nicht mehr angepasst. Diese Vorgehensweise fü…