Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Multimodal LLM”
Forschung

<p>Personagram: KI-gestützte Personas für kreatives Produktdesign</p> <p>Produktdesigner starten häufig mit handgefertigten Personas, doch diese bleiben oft abstrakt, kostenintensiv und schwer in konkrete Designentscheidungen umzusetzen. Personagram löst dieses Problem, indem es ein interaktives System nutzt, das multimodale große Sprachmodelle (MLLMs) einsetzt. Damit können Designer detaillierte, bevölkerungsstatistische Personas erkunden, daraus Produktmerkmale ableiten und diese gezielt für unterschiedli

arXiv – cs.AI
Forschung

<p>LMEE-Bench: LLM-basiertes Langzeitgedächtnis für eingebettete Exploration</p> <p>Eine neue Veröffentlichung auf arXiv (2601.10744v1) stellt das Konzept „Long‑term Memory Embodied Exploration“ (LMEE) vor, das darauf abzielt, eingebettete Agenten mit lebenslangem Lernen auszustatten. Ziel ist es, Agenten zu entwickeln, die nicht nur Aufgaben erledigen, sondern auch ihr episodisches Langzeitgedächtnis nutzen, um Entscheidungen über lange Zeiträume hinweg zu optimieren.</p> <p>Um die Fortschritte in diesem B

arXiv – cs.AI
Forschung

<p>MLLMs nutzen Bilder statt Text für 87,5 % bessere Kaufvorhersage</p> <p>Ein neues arXiv‑Papier beleuchtet, wie multimodale große Sprachmodelle (MLLMs) Nutzerverhalten interpretieren und welche Darstellungsform am effektivsten ist. Die Autoren stellen die Plattform <strong>BehaviorLens</strong> vor, ein Benchmarking‑Framework, das Transaktionsdaten in drei unterschiedlichen Modalitäten präsentiert: als Textabschnitt, als Streudiagramm und als Flussdiagramm.</p> <p>Durch die Analyse eines realen Kaufsequen

arXiv – cs.AI
Praxis

Alibaba stellt Ovis 2.5 vor: Multimodales LLM mit verbesserter Bildverarbeitung <p>Das AIDC‑AI‑Team von Alibaba hat sein neuestes multimodales Sprachmodell Ovis 2.5 veröffentlicht. Das Modell ist in zwei Varianten erhältlich – ein 9‑Billionen‑Parameter‑Modell und ein kompakteres 2‑Billionen‑Parameter‑Modell – und steht der Open‑Source‑Community frei zur Verfügung.</p> <p>Ovis 2.5 setzt neue Maßstäbe in Bezug auf Leistung und Effizienz. Durch die Integration von Techniken, die eine native Auflösung bei d

MarkTechPost