Anmelden

Nous Research stellt NousCoder-14B vor: RL-Trainiertes Olympiad-Modell

MarkTechPost • 19.01.2026 05:30 • Original • ≈1 Min. Lesezeit

#NousCoder-14B #Qwen3-14B #Reinforcement Learning #LiveCodeBench #Pass@1 #KI-gestützte Programmierlösungen #Olympische Programmierwettbewerbe

Nous Research hat das neue Modell NousCoder-14B vorgestellt, das speziell für olympische Programmierwettbewerbe entwickelt wurde. Durch ein post‑Training mit Qwen3-14B unter Einsatz von Reinforcement Learning und überprüfbaren Belohnungen erreicht das Modell auf dem LiveCodeBench v6 Benchmark – der die Aufgaben vom 08.01.2024 bis 05.01.2025 umfasst – eine Pass@1‑Genauigkeit von 67,87 %. Damit übertrifft es die Basisversion Qwen3-14B um 7,08 Prozentpunkte und setzt damit einen neuen Standard für KI‑gestützte Programmierlösungen.

Ähnliche Artikel

🍪 Cookie-Einstellungen