Produkt VentureBeat – AI

OpenAI präsentiert GPT‑5.1‑Codex‑Max: Das neue Coding-Modell schlägt Gemini 3 Pro

OpenAI hat das neue Coding-Modell GPT‑5.1‑Codex‑Max vorgestellt, das nun als Standardmodell in der Codex-Entwicklungsumgebung eingesetzt wird und GPT‑5.1‑Codex ersetzt. GPT‑5.1‑Codex‑Max zeichnet sich durch verbesserte…

≈1 Min. Lesezeit Originalquelle
Visuelle Illustration fuer KI-Kontext
Kernaussagen
Das nimmst du aus dem Beitrag mit
  • OpenAI hat das neue Coding-Modell GPT‑5.1‑Codex‑Max vorgestellt, das nun als Standardmodell in der Codex-Entwicklungsumgebung eingesetzt wird und GPT‑5.1‑Codex ersetzt.
  • GPT‑5.1‑Codex‑Max zeichnet sich durch verbesserte langfristige Logik, höhere Effizienz und Echtzeit-Interaktionsfähigkeiten aus.
  • Es agiert als persistenter, hochkontextualer Entwicklungsagent, der komplexe Refactorings, Debugging-Workflows und projektweite Aufgaben über mehrere Kontextfenster hinw…

OpenAI hat das neue Coding-Modell GPT‑5.1‑Codex‑Max vorgestellt, das nun als Standardmodell in der Codex-Entwicklungsumgebung eingesetzt wird und GPT‑5.1‑Codex ersetzt.

GPT‑5.1‑Codex‑Max zeichnet sich durch verbesserte langfristige Logik, höhere Effizienz und Echtzeit-Interaktionsfähigkeiten aus. Es agiert als persistenter, hochkontextualer Entwicklungsagent, der komplexe Refactorings, Debugging-Workflows und projektweite Aufgaben über mehrere Kontextfenster hinweg steuern kann.

Auf den wichtigsten Coding-Benchmarks übertrifft das Modell Google Gemini 3 Pro: Bei SWE‑Bench Verified erreicht es 77,9 % Genauigkeit im Vergleich zu 76,2 % von Gemini, bei Terminal‑Bench 2.0 erzielt es 58,1 % gegenüber 54,2 % und erzielt bei LiveCodeBench Pro einen Score von 2 439 – gleichwertig mit Gemini. In den agentischen Coding-Benchmarks hat es sogar einen leichten Vorteil gegenüber der Deep‑Thinking-Konfiguration von Gemini.

Weitere Leistungssteigerungen zeigen sich bei SWE‑Lancer IC SWE, wo GPT‑5.1‑Codex‑Max 79,9 % Genauigkeit erzielt, deutlich höher als die 66,3 % von GPT‑5.1‑Codex. Auch bei SWE‑Bench Verified erreicht das neue Modell 77,9 % Genauigkeit, was einen deutlichen Fortschritt gegenüber dem Vorgängermodell darstellt.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

OpenAI ist einer der wichtigsten Taktgeber fuer KI-Produkte, Modellstarts und API-Oekosysteme.

Trenne bei OpenAI-News immer zwischen Modellleistung, Distribution ueber ChatGPT und den Folgen fuer Entwickler im API-Stack.

Ist das ein Forschungs-, API- oder ChatGPT-Update?
Wer profitiert davon zuerst: Endnutzer, Builder oder Unternehmen?
Was veraendert sich praktisch?
Begriffe zum Einordnen

Kontext ohne Glossar-Suche

OpenAI
OpenAI ist einer der wichtigsten Taktgeber fuer KI-Produkte, Modellstarts und API-Oekosysteme.
GPT‑5.1‑Codex‑Max
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Codex
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
VentureBeat – AI
Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.
Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen