Forschung
VisTIRA schließt Bild-Text-Lücke in visueller Mathematik
Vision‑Language‑Modelle (VLMs) schneiden bei mathematischem Denken schlechter ab als reine Text‑Modelle, wenn dieselben Aufgaben als Bilder…
arXiv – cs.AI