SEAM: Benchmark prüft, ob Vision‑Language‑Modelle Modalitäten verstehen
Ein neues Benchmark‑Set namens SEAM (Semantically Equivalent Across Modalities) wurde vorgestellt, um die Konsistenz von Vision‑Language‑Modellen (VLMs) über verschiedene Darstellungsformen hinweg zu prüfen. SEAM kombin…