RIMO: Neues Olympiad-Benchmark für fortgeschrittenes mathematisches Denken
Mit dem neuen RIMO-Benchmark setzt die Forschung einen klaren Maßstab für die Fähigkeiten von großen Sprachmodellen (LLMs) im Bereich des fortgeschrittenen mathematischen Denkens. RIMO wurde entwickelt, um die Herausforderungen der International Mathematical Olympiad (IMO) zu nutzen, ohne die Bewertungslücken und Bias, die bei bestehenden Olympiad-Benchmarks auftreten.