Ostrakon‑VL: Neues multimodales Sprachmodell für Food‑Service und Einzelhandel
Ein neues multimodales Sprachmodell namens Ostrakon‑VL wurde speziell für die Anforderungen von Food‑Service‑ und Einzelhandelsgeschäften entwickelt. Das System basiert auf der Qwen3‑VL‑8B‑Architektur und nutzt fortschrittliche Techniken, um die Herausforderungen in diesen Bereichen zu meistern.
Die Entwickler haben drei zentrale Innovationen eingeführt: Erstens ein maßgeschneidertes Modell, zweitens ShopBench – die erste öffentliche Benchmark für Food‑Service‑ und Einzelhandelsdaten, und drittens QUAD, ein mehrstufiger Datenkuratierungsprozess, der die Qualität und Reproduzierbarkeit der Trainingsmaterialien sicherstellt.
Durch die Kombination dieser Ansätze erreicht Ostrakon‑VL einen durchschnittlichen Score von 60,1 auf ShopBench. Damit übertrifft es sogar größere Modelle wie Qwen3‑VL‑235B‑A22B (59,4) und das gleichskalige Qwen3‑VL‑8B (55,3). Die Ergebnisse zeigen, dass Ostrakon‑VL mit weniger Parametern eine höhere Effizienz und Zuverlässigkeit in der Wahrnehmung und Entscheidungsfindung für den Einzelhandel liefert.