Forschung
PRiSM: Neuer multimodaler Benchmark für wissenschaftliches Denken mit Python
Wissenschaftliche Bild‑und Textmodelle (VLMs) stehen vor einer neuen Herausforderung: Sie müssen nicht nur Antworten liefern, sondern auch…
arXiv – cs.AI