Suche nach Olympiad | meineki.news

Effiziente Mathematik-Wettbewerb: Off-the-Shelf Modelle übertreffen Goldmedaille

In den vergangenen zwölf Monaten haben maßgeschneiderte, bislang nicht veröffentlichte Mathematik‑Reasoning‑Modelle die Goldmedaille bei de…

arXiv – cs.LG 20.02.2026 05:00

Forschung

Leichtgewichtige KI-Pipeline löst Forschungsaufgaben in Mathematik

In einer bahnbrechenden Studie zeigen neue KI-Modelle, dass eine schlanke, sprachbasierte Pipeline in der Lage ist, komplexe Forschungsaufg…

arXiv – cs.AI 17.02.2026 05:00

Forschung

KI-Agent Aletheia revolutioniert mathematische Forschung

In den letzten Jahren haben sich die Grundlagenmodelle der KI so stark weiterentwickelt, dass sie nun sogar die goldmedaille‑Standardleistu…

arXiv – cs.AI 12.02.2026 05:00

Forschung

Open-Source-Vision‑Language‑Modell P1‑VL erzielt Rekord bei Physik‑Olympiaden

Ein neues Open‑Source-Visionsprache-Modell namens P1‑VL hat die Grenzen der wissenschaftlichen Argumentation in Physik‑Olympiaden neu defin…

arXiv – cs.AI 11.02.2026 05:00

Aktuell

Technologien, die 2026 die Winterolympiade neu gestalten

Die Winterolympiade 2026 in Mailand und Cortina wird durch innovative Technologien zu einem völlig neuen Erlebnis. Drohnen mit First‑Person…

Wired – AI (Latest) 07.02.2026 12:00

Forschung

Neues Benchmark FrontierScience prüft KI in Expertenwissenschaften

Die Wissenschafts-Community hat ein neues Benchmark namens FrontierScience vorgestellt, das die Fähigkeit von Sprachmodellen auf Expertenni…

arXiv – cs.AI 30.01.2026 05:00

Aktuell

Yi Tay: Vom IMO-Gold zum AGI-Team in Singapur – DeepMind's Wandel

In den letzten 18 Monaten hat Yi Tay die komplette Transformation von Google DeepMind begleitet – von der Forschung an Architekturen hin zu…

Latent Space 23.01.2026 16:00

Praxis

Nous Research stellt NousCoder-14B vor: RL-Trainiertes Olympiad-Modell

Nous Research hat das neue Modell NousCoder-14B vorgestellt, das speziell für olympische Programmierwettbewerbe entwickelt wurde. Durch ein…

MarkTechPost 19.01.2026 05:30

Forschung

GDEPO: Neue Methode steigert Reinforcement-Learning beim automatischen Theorembeweis

In der Welt des automatischen Theorembeweisens (ATP) hat sich Reinforcement Learning als Schlüsseltechnologie etabliert. Der aktuelle Stand…

arXiv – cs.AI 13.01.2026 05:00

Forschung

<h1>Multi-Agent-Modelle übertreffen Einzelagenten bei geometrischen Diagrammaufgaben</h1> <p>Eine neue Studie aus dem arXiv-Repository untersucht, ob mehrere Agenten in einem Pipeline-Ansatz besser als ein einzelner Agent bei der Lösung von geometrischen Problemen mit Diagrammen abschneiden. Dabei wurden vier führende visuelle Mathematik-Benchmarks – Geometry3K, MathVerse, OlympiadBench und We-Math – herangezogen, um die Leistungsunterschiede systematisch zu vergleichen.</p> <p>Für Open-Source-Modelle zeigt

arXiv – cs.AI 19.12.2025 05:00

Forschung

LLM-Agent löst Olympiad-Geometry mit neuer Lernmethode

Ein neues Large‑Language‑Model (LLM) namens InternGeometry hat gezeigt, dass KI-Agenten auf dem Niveau von Olympiad‑Gewinnern in Geometrie‑…

arXiv – cs.AI 12.12.2025 05:00

Forschung

RoBoN: Mehrere LLMs im Testzeit-Skalieren – Neue Methode steigert Genauigkeit

Eine neue Technik namens RoBoN (Routed Online Best‑of‑n) ermöglicht es, mehrere große Sprachmodelle (LLMs) gleichzeitig zu nutzen, um die G…

arXiv – cs.LG 08.12.2025 05:00

Aktuell

DeepSeek präsentiert zwei KI-Modelle, die GPT‑5 und Gemini‑3.0‑Pro Konkurrenz machen

Der chinesische KI-Start‑up DeepSeek hat am Sonntag zwei neue Modelle vorgestellt, die laut dem Unternehmen die Leistungsfähigkeit von Open…

VentureBeat – AI 01.12.2025 18:45

Forschung

IndiMathBench: Verifizierte Benchmark für automatisierte Mathematikformalisierung

IndiMathBench ist ein neu entwickeltes, von Menschen verifiziertes Benchmark‑Set, das die Leistungsfähigkeit von automatischen Theorem‑Prov…

arXiv – cs.AI 02.12.2025 05:00

Forschung

Effiziente Heuristik löst Olympiad-Geometrieprobleme ohne neuronale Netze

Automatisiertes Beweisen von Euklidischen Geometrietheoremen, insbesondere auf Olympiad-Niveau, bleibt ein zentrales Problem in der Künstli…

arXiv – cs.AI 02.12.2025 05:00

Forschung

ORION: Sprachmodelle lernen kompakte, effiziente Logik in Mentalese

Die neueste Forschung von ORION zeigt, wie große Sprachmodelle ihre Rechenleistung drastisch steigern können, indem sie lernen, in einer ko…

arXiv – cs.AI 01.12.2025 05:00

Praxis

DeepSeek AI stellt DeepSeekMath‑V2 vor: 118/120 bei Putnam 2024

DeepSeek AI hat mit DeepSeekMath‑V2 einen Meilenstein im Bereich der KI‑gestützten Mathematik erreicht. Das neue Modell, das auf dem Open‑W…

MarkTechPost 28.11.2025 09:35

Forschung

ChemLabs revolutioniert chemische Problemlösung: 93,6/100 bei IChO 2025 Benchmark

Die International Chemistry Olympiad (IChO) 2025 liefert nun ein neues, hochqualitatives Benchmark‑Set namens ChemO, das speziell für die B…

arXiv – cs.AI 21.11.2025 05:00

Forschung

Neue 3D-Testzeit-Skalierung verbessert KI-Logik bei komplexen Aufgaben

In einer aktuellen Veröffentlichung auf arXiv wird ein neues Konzept vorgestellt, das die Leistungsfähigkeit von KI-Modellen beim logischen…

arXiv – cs.LG 21.11.2025 05:00

Forschung

SciAgent: Multi-Agenten-System für interdisziplinäres wissenschaftliches Denken

Mit den jüngsten Fortschritten großer Sprachmodelle erreichen KI-Systeme inzwischen Expertenleistungen in fachspezifischen Aufgaben, bleibe…

arXiv – cs.AI 12.11.2025 05:00

Forschung

ScRPO: Selbstkorrektur-Algorithmus verbessert Sprachmodelle bei Mathematikaufgaben

In einer neuen Veröffentlichung auf arXiv wird ScRPO – Self‑Correction Relative Policy Optimization – vorgestellt, ein innovatives Reinforc…

arXiv – cs.AI 11.11.2025 05:00

Forschung

Neues Verfahren verbessert Zuverlässigkeit von LLMs bei komplexen Aufgaben

Ein neu veröffentlichter Ansatz namens Enhanced Dirichlet and Topology Risk (EDTR) verspricht, die Zuverlässigkeit von Large Language Model…

arXiv – cs.AI 11.11.2025 05:00

Forschung

<p>Neues ExtremBench-Benchmark enthüllt Schwächen von LLMs bei Extremalaufgaben</p> <p>Eine aktuelle Studie aus dem arXiv-Repository (ArXiv:2510.12997v1) präsentiert ExtremBench, ein neues Benchmark-Dataset, das speziell dafür entwickelt wurde, die Fähigkeit von Large Language Models (LLMs) zur Lösung von Extremalproblemen zu testen. Die Aufgaben stammen aus den Ungleichungsübungen der chinesischen Mathematik-Olympiade und wurden zu 93 standardisierten Extremalaufgaben umgewandelt.</p> <p>Die Autoren haben

arXiv – cs.LG 16.10.2025 05:00

Forschung

RIMO: Neues Olympiad-Benchmark für fortgeschrittenes mathematisches Denken

Mit dem neuen RIMO-Benchmark setzt die Forschung einen klaren Maßstab für die Fähigkeiten von großen Sprachmodellen (LLMs) im Bereich des f…

arXiv – cs.AI 10.09.2025 05:00

Forschung

LeanGeo: Formalisierung geometrischer Wettbewerbsaufgaben in Lean

Geometrieaufgaben stellen eine zentrale Testplattform für die Rechenfähigkeiten von KI-Systemen dar. Bisher können die meisten automatische…

arXiv – cs.AI 21.08.2025 05:00

Finde Modelle, Firmen und Themen

Effiziente Mathematik-Wettbewerb: Off-the-Shelf Modelle übertreffen Goldmedaille

Leichtgewichtige KI-Pipeline löst Forschungsaufgaben in Mathematik

KI-Agent Aletheia revolutioniert mathematische Forschung

Open-Source-Vision‑Language‑Modell P1‑VL erzielt Rekord bei Physik‑Olympiaden

Technologien, die 2026 die Winterolympiade neu gestalten

Neues Benchmark FrontierScience prüft KI in Expertenwissenschaften

Yi Tay: Vom IMO-Gold zum AGI-Team in Singapur – DeepMind's Wandel

Nous Research stellt NousCoder-14B vor: RL-Trainiertes Olympiad-Modell

GDEPO: Neue Methode steigert Reinforcement-Learning beim automatischen Theorembeweis

LLM-Agent löst Olympiad-Geometry mit neuer Lernmethode

RoBoN: Mehrere LLMs im Testzeit-Skalieren – Neue Methode steigert Genauigkeit

DeepSeek präsentiert zwei KI-Modelle, die GPT‑5 und Gemini‑3.0‑Pro Konkurrenz machen

IndiMathBench: Verifizierte Benchmark für automatisierte Mathematikformalisierung

Effiziente Heuristik löst Olympiad-Geometrieprobleme ohne neuronale Netze

ORION: Sprachmodelle lernen kompakte, effiziente Logik in Mentalese

DeepSeek AI stellt DeepSeekMath‑V2 vor: 118/120 bei Putnam 2024

ChemLabs revolutioniert chemische Problemlösung: 93,6/100 bei IChO 2025 Benchmark

Neue 3D-Testzeit-Skalierung verbessert KI-Logik bei komplexen Aufgaben

SciAgent: Multi-Agenten-System für interdisziplinäres wissenschaftliches Denken

ScRPO: Selbstkorrektur-Algorithmus verbessert Sprachmodelle bei Mathematikaufgaben

Neues Verfahren verbessert Zuverlässigkeit von LLMs bei komplexen Aufgaben

RIMO: Neues Olympiad-Benchmark für fortgeschrittenes mathematisches Denken

LeanGeo: Formalisierung geometrischer Wettbewerbsaufgaben in Lean

🍪 Cookie-Einstellungen

ChemLabs revolutioniert chemische Problemlösung: 93,6/100 bei IChO 2025 Benchmark