Neues Framework IRIS nutzt intrinsische Belohnung zur Bildgenerierung
Die jüngsten Fortschritte im Bereich Reinforcement Learning from Human Feedback (RLHF) haben vor allem bei der Sprachverarbeitung beeindruckende Resultate erzielt. Für die autoregressive Text‑zu‑Bild‑Generierung (T2I) s…