Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “MLLM”
Forschung

<p>Effiziente Tabellenabfrage und -verständnis mit multimodalen Sprachmodellen</p> <p>Tabellen, die als Bilder vorliegen – etwa in Finanzberichten, handschriftlichen Aufzeichnungen oder gescannten Dokumenten – stellen besondere Herausforderungen für die maschinelle Analyse dar. Sie vereinen strukturelle und visuelle Komplexität, die bislang nur schwer zu bewältigen ist.</p> <p>Moderne multimodale Large Language Models (MLLMs) haben zwar vielversprechende Fortschritte im Tabellenverständnis erzielt, gehen je

arXiv – cs.AI
Forschung

<p>Personagram: KI-gestützte Personas für kreatives Produktdesign</p> <p>Produktdesigner starten häufig mit handgefertigten Personas, doch diese bleiben oft abstrakt, kostenintensiv und schwer in konkrete Designentscheidungen umzusetzen. Personagram löst dieses Problem, indem es ein interaktives System nutzt, das multimodale große Sprachmodelle (MLLMs) einsetzt. Damit können Designer detaillierte, bevölkerungsstatistische Personas erkunden, daraus Produktmerkmale ableiten und diese gezielt für unterschiedli

arXiv – cs.AI