OpenMMReasoner: Mehr multimodale KI‑Logik mit kleineren, smarteren Datensätzen
Forscher von MiroMind AI in Zusammenarbeit mit mehreren chinesischen Universitäten haben das neue Trainingsframework OpenMMReasoner vorgestellt, das die multimodale Denkfähigkeit von Sprachmodellen deutlich steigert. Durch einen zweistufigen Ansatz wird zunächst ein Basismodell mit einem sorgfältig zusammengestellten Datensatz in einer Supervised Fine‑Tuning‑Phase verfeinert. Anschließend leitet ein Reinforcement‑Learning‑Schritt das Modell an, komplexe Aufgaben, die Text und Bild kombinieren, noch effektiver zu lösen.