Latente Chain-of-Thought als Planung: Trennung von Denken und Ausdruck

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues Verfahren namens PLaT (Planning with Latent Thoughts) präsentiert eine innovative Herangehensweise an die latente Chain-of-Thought-Logik. Dabei wird das Denken von der sprachlichen Ausführung getrennt, sodass das Modell selbst entscheiden kann, wann es mit dem Rechnen fertig ist.

PLaT modelliert die Überlegung als deterministische Folge von latenten Planungszuständen. Ein separater Decoder übersetzt diese Zustände dann bei Bedarf in Text. Durch diese Trennung kann das System dynamisch bestimmen, wann die Rechenphase beendet wird, anstatt auf feste Hyperparameter zurückzugreifen.

Tests an mathematischen Benchmarks zeigen, dass PLaT zwar bei der Greedy-Genauigkeit hinter einigen Baselines zurückbleibt, dafür aber eine deutlich größere Vielfalt an Lösungswegen erzeugt. Das Ergebnis ist ein robusteres und breiteres Lösungsfeld, das eine transparente und skalierbare Grundlage für Suchalgorithmen zur Laufzeit bietet.

Ähnliche Artikel