ChemVTS-Bench: Neuer Test für multimodale Chemie-Modelle
Die Chemie erfordert die gleichzeitige Verarbeitung von Bild-, Text- und Symbolinformationen. Bisherige Benchmarks greifen jedoch meist auf einfache Bild‑Text‑Paare zurück und erfassen die Komplexität chemischer Semantik nicht vollständig. Dadurch bleibt unklar, wie gut multimodale Large Language Models (MLLMs) tatsächlich chemisch relevante Daten über verschiedene Modalitäten hinweg verarbeiten können.