ChartComplete: Das umfassende, taxonomiebasierte Chart‑Dataset für KI‑Modelle

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Mit den jüngsten Fortschritten im Deep Learning und in der Computer‑Vision entwickelt sich das Feld der Diagramm‑Interpretation rasant weiter. Besonders multimodale große Sprachmodelle (MLLMs) zeigen dabei eine beeindruckende Genauigkeit beim Verstehen von Grafiken.

Um die Leistungsfähigkeit dieser Modelle zuverlässig zu bewerten, wurden bislang mehrere Benchmark‑Datensätze erstellt. Eine Analyse dieser Sammlungen hat jedoch gezeigt, dass sie nur eine sehr begrenzte Auswahl an Diagrammtypen abdecken. Das erschwert die Entwicklung und das Testen von Modellen, die für die breite Palette an Visualisierungen im Einsatz sein sollen.

Um diese Lücke zu schließen, stellt die Forschungsgemeinschaft das neue ChartComplete‑Dataset vor. Das Set basiert auf einer etablierten Diagramm‑Taxonomie aus der Visualisierungsgemeinschaft und umfasst insgesamt dreißig verschiedene Diagrammtypen. Jede Bilddatei ist eindeutig klassifiziert, jedoch enthält das Dataset keine Lernsignale, sodass es als reine Referenz für die Community dient.

ChartComplete wird als offene Ressource bereitgestellt, damit Entwickler, Forscher und Unternehmen ihre multimodalen Modelle darauf testen und weiterentwickeln können. Durch die Vielfalt der Diagrammtypen soll die Dataset‑Basis die Entwicklung robuster, allumfassender Chart‑Verständnis‑Algorithmen fördern.

Ähnliche Artikel