TopoPerception: Neue Benchmark enthüllt Schwächen globaler Bildverarbeitung in LVLMs
Die neueste Studie von TopoPerception zeigt, dass große Vision‑Language‑Modelle (LVLMs) bei der Erkennung globaler Bildstrukturen stark unterlegen sind. Während herkömmliche Tests oft lokale Abkürzungen nutzen, die die Wahrnehmungsfähigkeiten der Modelle überschätzen, setzt TopoPerception auf topologische Eigenschaften, die nur von der Gesamtstruktur eines Bildes abhängen.