Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Finanzberichte”
Forschung

<p>Effiziente Tabellenabfrage und -verständnis mit multimodalen Sprachmodellen</p> <p>Tabellen, die als Bilder vorliegen – etwa in Finanzberichten, handschriftlichen Aufzeichnungen oder gescannten Dokumenten – stellen besondere Herausforderungen für die maschinelle Analyse dar. Sie vereinen strukturelle und visuelle Komplexität, die bislang nur schwer zu bewältigen ist.</p> <p>Moderne multimodale Large Language Models (MLLMs) haben zwar vielversprechende Fortschritte im Tabellenverständnis erzielt, gehen je

arXiv – cs.AI