KI News: Kurz und klar.

Anmelden

Iterative Reward‑Guided Refinement: Testzeit‑Skalierung für diskrete Diffusion In der Welt der diskreten Diffusionsmodelle bleibt die Skalierung während der Testphase bislang weitgehend unerforscht, obwohl sie ein vielversprechender alternativer Ansatz darstellt. Forscher haben deshalb Iterative Reward‑Guided Refinement (IterRef) entwickelt, ein neues Verfahren, das gezielt die Qualität von generierten Texten und Bildern verbessern soll. IterRef nutzt ein belohnungsorientiertes Verfahren, bei dem währen

arXiv – cs.LG • 11.11.2025 05:00 • Original

Anzeige