Forschung
Transformer-Modelle meistern DDPM-Denoiser für Multi-Token-GMMs
In einer wegweisenden Studie zeigen Forscher erstmals, warum Transformer-basierte Diffusionsmodelle so erfolgreich sind. Durch eine gründli…
arXiv – cs.LG