MARVAL beschleunigt Masked Auto-Regressive Diffusion: Schnelle Inferenz für RL

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Verfahren namens MARVAL (Masked Auto‑Regressive Variational Acceleration) hat die Inferenzgeschwindigkeit von Masked Auto‑Regressive Diffusion Modellen drastisch erhöht. Durch eine gezielte Distillation wird die bisher hierarchische Diffusionskette in einen einzigen autoregressiven Schritt zusammengefasst, ohne die Bildqualität zu beeinträchtigen.

Die Innovation ermöglicht es, die Modelle nach dem Training mit Reinforcement‑Learning (RL) zu optimieren, wobei die Belohnungen verifizierbar bleiben. Auf dem ImageNet‑Datensatz in 256×256 Pixeln erreicht MARVAL‑Huge einen FID‑Wert von 2,00 und beschleunigt die Generierung um mehr als das 30‑fache im Vergleich zu herkömmlichen MAR‑Diffusionsmodellen.

Die beiden Kernbeiträge von MARVAL sind: Erstens ein neues score‑basiertes Variationsziel, das die Distillation ohne Qualitätsverlust ermöglicht; zweitens ein effizientes RL‑Framework, MARVAL‑RL, das konsistente Verbesserungen in CLIP‑ und Bild‑Belohnungsmetriken erzielt.

Mit dieser Kombination aus hoher Bildqualität, enormer Geschwindigkeit und praktischer RL‑Anwendbarkeit stellt MARVAL einen bedeutenden Fortschritt für generative Modelle dar, die in realen Anwendungen eingesetzt werden sollen.

Ähnliche Artikel