Von Bits zu Runden: Parallel-Decodierung mit Exploration für Diffusionsmodelle
Diffusions-Sprachmodelle (DLMs) haben sich als starke Alternative zu autoregressiven Modellen etabliert. Sie liefern vergleichbare Genauigkeit, aber dank paralleler Decodierung viel schnellere Inferenz. Allerdings stoße…