We-Math 2.0: Revolutionäres System zur Förderung mathematischer Visualisierung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die neuesten multimodalen Sprachmodelle (MLLMs) zeigen beeindruckende Leistungen, doch bei komplexen mathematischen Aufgaben bleiben sie oft hinter den Erwartungen zurück. Mit dem neuen We‑Math 2.0‑System wird dieses Problem angegangen, indem ein ganzheitlicher Ansatz aus strukturiertem Wissen, modellzentriertem Datenraum und einem Reinforcement‑Learning‑Training kombiniert wird.

We‑Math 2.0 besteht aus vier Kernkomponenten. Erstens bietet das MathBook Knowledge System eine fünf‑stufige Hierarchie mit 491 Wissenspunkten und 1.819 Grundprinzipien, die ein tiefes Verständnis mathematischer Konzepte ermöglichen. Zweitens wurden die Datensätze MathBook‑Standard und MathBook‑Pro entwickelt: Der Standard‑Datensatz deckt ein breites Spektrum an Themen ab, während MathBook‑Pro durch eine dreidimensionale Schwierigkeits‑Skala und sieben Varianten pro Problem ein anspruchsvolles Trainingsumfeld schafft.

Die Trainingsstrategie, MathBook‑RL, nutzt ein zweistufiges Reinforcement‑Learning. Zunächst erfolgt ein Cold‑Start Fine‑Tuning, das das Modell an wissensorientiertes Chain‑of‑Thought‑Reasoning anpasst. Anschließend sorgt ein Progressive Alignment‑RL‑Modell, das auf durchschnittlicher Belohnung basiert und dynamisch Daten auswählt, für eine schrittweise Verbesserung über alle Schwierigkeitsstufen hinweg.

Abschließend stellt MathBookEval ein umfassendes Benchmark‑Set bereit, das die Fortschritte der MLLMs in mathematischem Denken objektiv bewertet. Mit We‑Math 2.0 wird ein neuer Standard für die Entwicklung und Bewertung von KI‑Systemen im Bereich der mathematischen Visualisierung gesetzt.

Ähnliche Artikel