Forschung
CoRe: Kontextrobuste Remasking-Technik verbessert Diffusion-Sprachmodelle
Die Standard-Decodierung in Masked Diffusion Models (MDMs) leidet unter einer zu starren Kontextbehandlung: Tokens werden auf Basis von kur…
arXiv – cs.LG