Meta‑TTRL: Metakognitives Framework für selbstverbesserndes Testzeit‑Reinforcement in multimodalen Modellen
Ein neues Forschungsprojekt namens Meta‑TTRL präsentiert ein metakognitives Testzeit‑Reinforcement‑Learning‑Framework, das die Leistungsfähigkeit von multimodalen Modellen (UMMs) in der Text‑zu‑Bild‑Generierung signifik…