Baidu präsentiert Multimodal-Model: Mehr Leistung, weniger Rechenaufwand
Baidu Inc., das größte Suchmaschinenunternehmen Chinas, hat am Montag ein neues, quelloffenes KI-Modell vorgestellt, das laut den Entwicklern bei mehreren bildbezogenen Benchmarks die Konkurrenz von Google und OpenAI übertrifft. Das Modell, genannt ERNIE‑4.5‑VL‑28B‑A3B‑Thinking, soll die Fähigkeit besitzen, Bilder, Videos und Dokumente zusammen mit Text zu verstehen und logisch zu verarbeiten – ein entscheidender Vorteil für Unternehmensanwendungen wie automatisierte Dokumentenverarbeitung und Qualitätskontrolle in der Industrie.