gpt-oss-120b & gpt-oss-20b: Offene Modelle mit hoher Genauigkeit

arXiv – cs.AI • 18.08.2025 05:00 • Original • ≈1 Min. Lesezeit

OpenAI hat zwei neue Open‑Weight‑Modelle vorgestellt: gpt‑oss‑120b und gpt‑oss‑20b. Beide setzen neue Maßstäbe in Genauigkeit und Effizienz und nutzen eine effiziente Mixture‑of‑Expert‑Transformer‑Architektur.

Die Modelle wurden mit groß angelegter Distillation und Reinforcement‑Learning trainiert und sind speziell auf agentische Fähigkeiten ausgelegt. Sie können tiefgreifende Recherchen durchführen, Python‑Tools einsetzen und Funktionen von Entwicklern nutzen – alles in einem klar strukturierten Chat‑Format, das präzises Befolgen von Anweisungen und Rollenunterscheidungen ermöglicht.

Auf einer Vielzahl von Benchmarks, darunter Mathematik, Programmieren und Sicherheitsprüfungen, erzielen gpt‑oss‑120b und gpt‑oss‑20b beeindruckende Ergebnisse. Die Modellgewichte, Inferenz‑Implementierungen, Tool‑Umgebungen und Tokenizer werden unter der Apache‑2.0‑Lizenz veröffentlicht, um eine breite Nutzung und weitere Forschung zu fördern.

Ähnliche Artikel

🍪 Cookie-Einstellungen