TableVision: Benchmark für räumlich fundiertes Tabellenverständnis
In der Welt der großen multimodalen Sprachmodelle (MLLMs) bleibt die Fähigkeit, komplexe hierarchische Tabellen zu verstehen, ein großes Problem. Forscher haben einen entscheidenden Wahrnehmungshindernis identifiziert…