Forschung
Neues Tri-Modal Diffusion-Modell: 3B-Parameter-Ansatz für Text, Bild und Audio
Ein völlig neuer Ansatz für multimodale KI hat die Forschung erschüttert: Das erste Tri‑Modal‑Masked‑Diffusion‑Modell, das von Grund auf mi…
arXiv – cs.LG