Nous Research stellt NousCoder-14B vor: RL-Trainiertes Olympiad-Modell
Nous Research hat das neue Modell NousCoder-14B vorgestellt, das speziell für olympische Programmierwettbewerbe entwickelt wurde. Durch ein post‑Training mit Qwen3-14B unter Einsatz von Reinforcement Learning und überprüfbaren Belohnungen erreicht das Modell auf dem LiveCodeBench v6 Benchmark – der die Aufgaben vom 08.01.2024 bis 05.01.2025 umfasst – eine Pass@1‑Genauigkeit von 67,87 %. Damit übertrifft es die Basisversion Qwen3-14B um 7,08 Prozentpunkte und setzt damit einen neuen Standard für KI‑gestützte Programmierlösungen.