Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Multimodale große Sprachmodelle”
Forschung

<h1>Neues Modell liefert semantisch korrekte Rezepte aus Bildern</h1> <p>Multimodale große Sprachmodelle können inzwischen Rezepte aus Fotos generieren, doch die Ergebnisse enthalten häufig falsche Kochschritte oder Zutaten, obwohl die Wortgenauigkeit hoch ist. Ein neues, semantisch fundiertes Verfahren löst dieses Problem, indem es Aktionen und Zutaten als internes Kontextmaterial für die Anweisungs­generierung nutzt.</p> <p>Der Ansatz besteht aus zwei Stufen: Zunächst wird ein Supervised Fine‑Tuning (SFT)

arXiv – cs.AI
Forschung

<p>Personagram: KI-gestützte Personas für kreatives Produktdesign</p> <p>Produktdesigner starten häufig mit handgefertigten Personas, doch diese bleiben oft abstrakt, kostenintensiv und schwer in konkrete Designentscheidungen umzusetzen. Personagram löst dieses Problem, indem es ein interaktives System nutzt, das multimodale große Sprachmodelle (MLLMs) einsetzt. Damit können Designer detaillierte, bevölkerungsstatistische Personas erkunden, daraus Produktmerkmale ableiten und diese gezielt für unterschiedli

arXiv – cs.AI
Forschung

<p>MLLMs nutzen Bilder statt Text für 87,5 % bessere Kaufvorhersage</p> <p>Ein neues arXiv‑Papier beleuchtet, wie multimodale große Sprachmodelle (MLLMs) Nutzerverhalten interpretieren und welche Darstellungsform am effektivsten ist. Die Autoren stellen die Plattform <strong>BehaviorLens</strong> vor, ein Benchmarking‑Framework, das Transaktionsdaten in drei unterschiedlichen Modalitäten präsentiert: als Textabschnitt, als Streudiagramm und als Flussdiagramm.</p> <p>Durch die Analyse eines realen Kaufsequen

arXiv – cs.AI