OpenAI präsentiert GPT‑5.1‑Codex‑Max: Das neue Coding-Modell schlägt Gemini 3 Pro
OpenAI hat das neue Coding-Modell GPT‑5.1‑Codex‑Max vorgestellt, das nun als Standardmodell in der Codex-Entwicklungsumgebung eingesetzt wird und GPT‑5.1‑Codex ersetzt.
GPT‑5.1‑Codex‑Max zeichnet sich durch verbesserte langfristige Logik, höhere Effizienz und Echtzeit-Interaktionsfähigkeiten aus. Es agiert als persistenter, hochkontextualer Entwicklungsagent, der komplexe Refactorings, Debugging-Workflows und projektweite Aufgaben über mehrere Kontextfenster hinweg steuern kann.
Auf den wichtigsten Coding-Benchmarks übertrifft das Modell Google Gemini 3 Pro: Bei SWE‑Bench Verified erreicht es 77,9 % Genauigkeit im Vergleich zu 76,2 % von Gemini, bei Terminal‑Bench 2.0 erzielt es 58,1 % gegenüber 54,2 % und erzielt bei LiveCodeBench Pro einen Score von 2 439 – gleichwertig mit Gemini. In den agentischen Coding-Benchmarks hat es sogar einen leichten Vorteil gegenüber der Deep‑Thinking-Konfiguration von Gemini.
Weitere Leistungssteigerungen zeigen sich bei SWE‑Lancer IC SWE, wo GPT‑5.1‑Codex‑Max 79,9 % Genauigkeit erzielt, deutlich höher als die 66,3 % von GPT‑5.1‑Codex. Auch bei SWE‑Bench Verified erreicht das neue Modell 77,9 % Genauigkeit, was einen deutlichen Fortschritt gegenüber dem Vorgängermodell darstellt.