Neuer Ansatz: Problemlösung durch gezielte Datensynthese für große Modelle
In einer wegweisenden Veröffentlichung präsentiert ein Forschungsteam einen innovativen Ansatz zur Datensynthese, der große Rechenmodelle für komplexe Problemlösungen effizienter trainiert. Statt auf die herkömmliche, oft unkontrollierte Generierung von Aufgaben zurückzugreifen, nutzt der neue Generator gezielt logisches Denken, um die Richtung der Probleme vorab zu planen und deren Schwierigkeitsgrad an die Fähigkeiten des Lösers anzupassen.
Der Schlüssel liegt in der Kombination von Problem‑Paaren und einer sogenannten „Chain‑of‑Thought“ (CoT), die von einem fortgeschrittenen Rechenmodell erzeugt wird. Diese Zwischenschritte dienen als Leitfaden für die Generator‑Strategie und ermöglichen es, Aufgaben zu schaffen, die nicht nur vielfältig, sondern auch tiefgründig sind. Durch die Rückmeldung des Lösers wird ein Belohnungssignal generiert, das den Generator kontinuierlich anpasst und dafür sorgt, dass die neuen Aufgaben stets am Rand der Kompetenz des Modells liegen.
Umfangreiche Tests an zehn mathematischen und allgemeinen Denk‑Benchmarks zeigen, dass der Ansatz durchschnittlich 2,5 % bessere Ergebnisse erzielt und sich gleichermaßen für reine Sprachmodelle wie für Vision‑Language‑Modelle eignet. Darüber hinaus führt ein Solver, der mit den synthetisierten Daten trainiert wurde, zu noch besseren Belohnungen für die weitere Generator‑Optimierung – ein Prozess, der als Co‑Evolution bezeichnet wird und einen zusätzlichen Leistungszuwachs von 0,7 % ermöglicht.
Die Autoren geben an, dass der komplette Code öffentlich zugänglich sein wird, sodass die Forschungsgemeinschaft die Methode sofort in eigenen Projekten einsetzen kann.