Forschung
MAPLE: Modality-Aware Post-Training – 30 % Genauigkeitsgewinn, 3‑fach Konvergenz
Multimodale Sprachmodelle kombinieren Text, Audio und Video zu einer einheitlichen Denkweise. In der Praxis werden jedoch bei bestehenden R…
arXiv – cs.AI