LLM-Agent löst Olympiad-Geometry mit neuer Lernmethode

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues Large‑Language‑Model (LLM) namens InternGeometry hat gezeigt, dass KI-Agenten auf dem Niveau von Olympiad‑Gewinnern in Geometrie‑Problemen agieren können. Durch die Kombination von iterativen Vorschlägen, symbolischer Verifikation und reflektierendem Lernen über die Rückmeldungen des Engines überwindet InternGeometry die bisherige Schwäche bei der Auswahl von Hilfs­konstruktionen.

Der Agent arbeitet mit einem dynamischen Speicher, der mehr als 200 Interaktionen pro Problem ermöglicht. Dabei nutzt er die neu entwickelte „Complexity‑Boosting Reinforcement Learning“ (CBRL)-Methode, die die Schwierigkeit der generierten Aufgaben schrittweise erhöht und so das Lernen beschleunigt.

Auf Basis des InternThinker‑32B-Modells löst InternGeometry 44 von 50 International Mathematical Olympiad (IMO) Geometrie‑Aufgaben aus den Jahren 2000 bis 2024 – ein Ergebnis, das den durchschnittlichen Goldmedaillengewinner übertrifft. Das Training erfolgte mit lediglich 13.000 Beispielen, was nur 0,004 % der Datenmenge von AlphaGeometry 2 entspricht. Darüber hinaus schlägt InternGeometry neue Hilfs­konstruktionen vor, die in menschlichen Lösungen nicht vorkommen, und demonstriert damit das enorme Potenzial von LLM‑Agenten für hochkomplexe geometrische Aufgaben.

Ähnliche Artikel