SPA-Cache: Effiziente Caching-Strategie für Diffusions-Sprachmodelle
Diffusions-Sprachmodelle (DLMs) bieten eine flexible Alternative zum autoregressiven Ansatz, doch ihre nicht-kausale Struktur verhindert die Nutzung herkömmlicher KV‑Caches. Das führt zu aufwändiger Neuberechnung der ve…