Forschung
Aufdeckung des Attention‑Floating‑Mechanismus in Masked Diffusion Modellen
Maskierte Diffusionsmodelle (MDMs) nutzen bidirektionale Aufmerksamkeitsmechanismen und einen Rauschreduktionsprozess, um die Leistungslück…
arXiv – cs.LG