Neues Geometric Reasoner verbessert Langkettige Logik ohne Trainingsaufwand
Ein völlig neues, trainingsfreies Framework namens Geometric Reasoner (TGR) hat die Art und Weise, wie große Sprachmodelle lange Argumentationsketten verarbeiten, revolutioniert. Durch die Kombination einer schlanken Vorhersagefunktion mit weichen geometrischen Regularisierern erzeugt TGR an jeder Chunk-Grenze intelligente „Latent Anchors“, die sowohl glatte als auch vielfältige Pfade durch den Gedankengang fördern.
Die Technik nutzt einen strikt begrenzten Speicher: Durch das Zurücksetzen des KV-Caches nach jedem Chunk bleibt die Speicherbelastung linear zum Chunk-Länge. Damit wird die Rechenzeit drastisch reduziert, ohne die Qualität der Ergebnispfade zu beeinträchtigen.
In anspruchsvollen Mathematik- und Programmieraufgaben konnte TGR die robuste Pfadabdeckung, gemessen an der Fläche unter der Pass@k-Kurve (AUC), um bis zu 13 Punkte gegenüber bestehenden Methoden steigern – insbesondere bei Qwen3-8B. Gleichzeitig bleibt die Laufzeit nur um 1,1 bis 1,3‑fach höher, was die Lösung besonders effizient macht.