Schnelligkeit als Vertrauenssignal: KI löst Sudoku mit weniger Rechenleistung

arXiv – cs.LG Original ≈2 Min. Lesezeit
Anzeige

Biologische Nervensysteme sind extrem schnell, aber gleichzeitig stark energiebeschränkt. Die Evolution hat dafür eine elegante Lösung gefunden: Sie reagiert auf das erste Signal. In neuronalen Schaltkreisen wird das erste Auslösen eines Neurons als Ausdruck von Vertrauen interpretiert. Dieses Prinzip nutzt ein neues KI-Modell, das Tiny Recursive Models (TRM) in Ensembles kombiniert.

Statt die Vorhersagen aller Modelle zu mitteln, entscheidet das System ausschließlich über das erste Modell, das seine Berechnung abschließt. Auf dem anspruchsvollen Sudoku‑Extreme‑Test erreicht diese Strategie 97,2 % Genauigkeit – das entspricht dem Niveau von Test‑Time‑Augmentation (TTA) – und spart dabei zehnmal weniger Rechenleistung. Die Geschwindigkeit der Inferenz wird somit zu einem impliziten Vertrauensindikator.

Auch im Training kann die Idee der „Winner‑Take‑All“-Strategie genutzt werden. Durch gleichzeitiges Halten von vier parallelen latenten Zuständen und das Back‑Propagation nur über denjenigen mit dem niedrigsten Verlust, erzielt ein einzelnes Modell 96,9 % Genauigkeit bei einer einzigen Vorwärtsausführung – gleichwertig zu TTA, ohne dass zusätzliche Testzeit benötigt wird. Alle Experimente wurden auf einer einzigen RTX 5090 durchgeführt, was die Notwendigkeit von Effizienzsteigerungen betonte. Ein modifiziertes SwiGLU wurde entwickelt, um die Muon‑Architektur nutzbar zu machen.

Mit Muon und einer Trainingskonfiguration von K = 1 übertrifft das Modell die TRM‑Basis in nur 7.000 Schritten (40 Minuten). Für höhere Genauigkeit sind 36.000 Schritte nötig: 1,5 Stunden bei K = 1 und 6 Stunden bei K = 4. Diese Ergebnisse zeigen, dass Geschwindigkeit und Vertrauen eng miteinander verknüpft sind und gleichzeitig die Rechenkosten drastisch reduzieren lassen.

Ähnliche Artikel