KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Olympiade”

LLM-Olympiade: Warum verschlossene Tests Vertrauen in Modelle stärken

In der heutigen Ära der großen Sprachmodelle (LLMs) sind Benchmarks und Leaderboards zwar weiterhin wichtige Messinstrumente, doch ihre Erg…

arXiv – cs.AI 25.03.2026 04:00

Effiziente Mathematik-Wettbewerb: Off-the-Shelf Modelle übertreffen Goldmedaille

In den vergangenen zwölf Monaten haben maßgeschneiderte, bislang nicht veröffentlichte Mathematik‑Reasoning‑Modelle die Goldmedaille bei de…

arXiv – cs.LG 20.02.2026 05:00

KI-Agent Aletheia revolutioniert mathematische Forschung

In den letzten Jahren haben sich die Grundlagenmodelle der KI so stark weiterentwickelt, dass sie nun sogar die goldmedaille‑Standardleistu…

arXiv – cs.AI 12.02.2026 05:00

Open-Source-Vision‑Language‑Modell P1‑VL erzielt Rekord bei Physik‑Olympiaden

Ein neues Open‑Source-Visionsprache-Modell namens P1‑VL hat die Grenzen der wissenschaftlichen Argumentation in Physik‑Olympiaden neu defin…

arXiv – cs.AI 11.02.2026 05:00

Technologien, die 2026 die Winterolympiade neu gestalten

Die Winterolympiade 2026 in Mailand und Cortina wird durch innovative Technologien zu einem völlig neuen Erlebnis. Drohnen mit First‑Person…

Wired – AI (Latest) 07.02.2026 12:00

DeepSeek präsentiert zwei KI-Modelle, die GPT‑5 und Gemini‑3.0‑Pro Konkurrenz machen

Der chinesische KI-Start‑up DeepSeek hat am Sonntag zwei neue Modelle vorgestellt, die laut dem Unternehmen die Leistungsfähigkeit von Open…

VentureBeat – AI 01.12.2025 18:45

SciAgent: Multi-Agenten-System für interdisziplinäres wissenschaftliches Denken

Mit den jüngsten Fortschritten großer Sprachmodelle erreichen KI-Systeme inzwischen Expertenleistungen in fachspezifischen Aufgaben, bleibe…

arXiv – cs.AI 12.11.2025 05:00

<p>Neues ExtremBench-Benchmark enthüllt Schwächen von LLMs bei Extremalaufgaben</p> <p>Eine aktuelle Studie aus dem arXiv-Repository (ArXiv:2510.12997v1) präsentiert ExtremBench, ein neues Benchmark-Dataset, das speziell dafür entwickelt wurde, die Fähigkeit von Large Language Models (LLMs) zur Lösung von Extremalproblemen zu testen. Die Aufgaben stammen aus den Ungleichungsübungen der chinesischen Mathematik-Olympiade und wurden zu 93 standardisierten Extremalaufgaben umgewandelt.</p> <p>Die Autoren haben

arXiv – cs.LG 16.10.2025 05:00

LeanGeo: Formalisierung geometrischer Wettbewerbsaufgaben in Lean

Geometrieaufgaben stellen eine zentrale Testplattform für die Rechenfähigkeiten von KI-Systemen dar. Bisher können die meisten automatische…

arXiv – cs.AI 21.08.2025 05:00