Baidu präsentiert proprietäres ERNIE 5.0: Mehr als GPT‑5 in Text, Bild, Audio und Video
Baidu hat bei seiner Baidu World 2025-Veranstaltung das neue, proprietäre Foundation‑Model ERNIE 5.0 vorgestellt. Das Modell ist nativ omni‑modal und kann gleichzeitig Text, Bilder, Audio und Video verarbeiten und generieren – ein deutlicher Schritt nach vorn im Vergleich zu bisherigen Modellen.
ERNIE 5.0 steht ausschließlich über die ERNIE Bot‑Website und die Qianfan‑Cloud‑API für Unternehmenskunden zur Verfügung. Im Gegensatz zu Baidus offenem ERNIE‑4.5‑VL‑28B‑A3B‑Thinking, das unter der Apache‑2.0‑Lizenz freigegeben ist, bleibt ERNIE 5.0 ein geschütztes Produkt.
Zur Einführung des Modells hat Baidu zudem bedeutende Updates an seiner Digital‑Human‑Plattform, an No‑Code‑Tools und an generischen KI‑Agenten angekündigt. Diese Neuerungen sollen die Reichweite des Unternehmens über China hinaus erweitern und es als globalen Wettbewerber im Enterprise‑AI‑Markt positionieren.
Ein spezielles Preview‑Modell, ERNIE 5.0 Preview 1022, wurde für textintensive Aufgaben optimiert, während die Standard‑Preview-Version ein ausgewogenes Verhältnis zwischen den Modalitäten bietet. Baidu betont, dass ERNIE 5.0 die Art und Weise verändert, wie KI in großem Maßstab eingesetzt wird.
Die Ankündigung folgte nur wenige Stunden nach der Aktualisierung von OpenAI’s GPT‑5 zu GPT‑5.1, die geringeren Token‑Verbrauch und verbesserte Personalisierung versprach. Baidu nutzt die Gelegenheit, um seine Position im zunehmend wettbewerbsintensiven KI‑Markt zu stärken.