Forschung
TableVision: Benchmark für räumlich fundiertes Tabellenverständnis
In der Welt der großen multimodalen Sprachmodelle (MLLMs) bleibt die Fähigkeit, komplexe hierarchische Tabellen zu verstehen, ein großes Pr…
arXiv – cs.AI