Forschung
ENACT: Benchmark prüft, ob Vision‑Language‑Modelle wirklich sensorisch handeln
Die neue Studie „ENACT“ stellt Vision‑Language‑Modelle (VLMs) einer einzigartigen Herausforderung gegenüber: Sie prüfen, ob diese Systeme w…
arXiv – cs.AI