Neues Verfahren BFR korrigiert Bias in generativen Modellen ohne Rauschzufuhr

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Welt der generativen Modelle – von Diffusion bis hin zu Flow-basierten Architekturen – treten häufig systematische Verzerrungen auf, die die Bildqualität stark beeinträchtigen. Ein kürzlich veröffentlichter Beitrag auf arXiv stellt diese Herausforderung neu in den Fokus und zeigt, dass Bias‑Korrekturen auch ohne Rauschzufuhr und ohne mehrstufige Resampling‑Schritte möglich sind.

Das vorgestellte Bi‑Stage Flow Refinement (BFR) nutzt zwei gezielte Optimierungsstufen: Zunächst wird im latenten Raum ein Alignment für fast invertierbare Generatoren durchgeführt, anschließend erfolgt eine Datenraum‑Verfeinerung, die mit leichtgewichtigen Augmentierungen trainiert wird. Durch die Beibehaltung der ursprünglichen ODE‑Trajektorie und deterministische Korrekturen der generierten Samples bleibt die Modellstruktur unverändert, während die Bildqualität signifikant gesteigert wird.

Experimentelle Ergebnisse auf MNIST, CIFAR‑10 und FFHQ (256×256) belegen konsistente Verbesserungen in Bezug auf Fidelity und Coverage. Besonders beeindruckend ist die Erreichung eines FID‑Werts von 1,46 auf MNIST – ein neuer Bestwert – ab einem Ausgangs‑FID von 3,95, und das mit nur einer zusätzlichen Funktionsauswertung (1‑NFE). Gleichzeitig bleibt die Vielfalt der erzeugten Bilder erhalten, was BFR zu einer vielversprechenden Lösung für die Praxis macht.

Ähnliche Artikel