CoReTab: Codebasierte Logik verbessert multimodale Tabellenverständnis
In der Welt der multimodalen Tabellenanalyse haben bisherige Datensätze wie MMTab vor allem kurze, faktenbasierte Antworten geliefert, ohne explizite Unterstützung für mehrstufige Schlussfolgerungen. Das führte dazu, dass trainierte Modelle oft knapp antworteten, die Genauigkeit niedrig blieb und die Nachvollziehbarkeit der Entscheidungswege stark eingeschränkt war.