ReMindView-Bench: Benchmark enthüllt Schwächen von VLMs bei Mehransicht‑Räumlichkeit
Die neu veröffentlichte Studie präsentiert ReMindView-Bench, ein kognitiv fundiertes Benchmark, das die Fähigkeit von Vision‑Language‑Modellen (VLMs) testet, räumliche mentale Modelle über mehrere Ansichten hinweg zu konstruieren, auszurichten und zu erhalten.