Mechanismuswechsel: Post-Training von ARMs zu Masked Diffusion Modellen
In einer wegweisenden Studie wurde gezeigt, dass das Post‑Training von autoregressiven Sprachmodellen (ARMs) zu Masked Diffusion Modellen (MDMs) weit mehr als nur Parameteranpassungen bewirkt. Durch eine detaillierte zi…