COVER: Schnellere Diffusion mit kontextbewusster Verifikation
Die Parallelisierung von Diffusionsmodellen kann die Inferenzgeschwindigkeit erheblich steigern, indem mehrere Tokens gleichzeitig entschlüsselt werden. In der Praxis führt diese aggressive Parallelität jedoch häufig zu…