MM‑Food‑100K: 100.000 multimodale Essensdaten für KI mit nachvollziehbarer Herkunft

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Das neue MM‑Food‑100K‑Datensatz setzt neue Maßstäbe für die Forschung im Bereich Food‑Intelligence. Mit 100.000 hochqualitativen, multimodalen Bild‑ und Metadatenpunkten bietet er eine unvergleichliche Basis für die Entwicklung und das Training von KI‑Modellen, die Ernährung, Rezeptanalyse und kulinarische Trends verstehen.

Der Datensatz ist ein sorgfältig kuratiertes 10 %‑Offene‑Subset eines ursprünglichen Korpus von 1,2 Millionen Bildern, die alle Qualitätsstandards erfüllen. Jedes Bild ist mit umfangreichen Annotationen versehen – von Gerichtsnamen über Herkunftsregion bis hin zu Nährwertinformationen – und steht in einem klar definierten Schema zur Verfügung.

Die Sammlung erfolgte in nur sechs Wochen und wurde von über 87.000 Mitwirkenden unterstützt. Das Codatta‑Modell kombiniert Community‑Sourcing mit konfigurierbaren, KI‑gestützten Qualitätsprüfungen. Jede Einreichung ist über eine Wallet‑Adresse in einem sicheren Off‑Chain‑Ledger nachverfolgbar, wobei ein vollständiges On‑Chain‑Protokoll bereits in Planung ist.

Zur Validierung der Nützlichkeit wurden große Vision‑Language‑Modelle – darunter ChatGPT 5, ChatGPT OSS und Qwen‑Max – auf die Bild‑basierte Nährwertvorhersage feinabgestimmt. Die Feinabstimmung erzielte konsistente Verbesserungen gegenüber den Ausgangsmodellen und demonstriert damit den praktischen Mehrwert des Datensatzes.

MM‑Food‑100K wird kostenfrei für die Öffentlichkeit freigegeben, während rund 90 % des Korpus für kommerzielle Anwendungen mit einer Umsatzbeteiligung an die ursprünglichen Beitragenden reserviert bleiben. Damit eröffnet der Datensatz neue Möglichkeiten für Forschung, Industrie und die Gemeinschaft gleichermaßen.

Ähnliche Artikel