DTS: Enhancing Large Reasoning Models via Decoding Tree Sketching
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
Neues Belohnungssystem reduziert Überdenken bei großen Rechenmodellen
arXiv – cs.AI
•
Hermes: LLMs kombinieren informelle und formale Mathematik, höhere Genauigkeit
arXiv – cs.AI
•
Kleines Modell, Logik: VibeThinker-1.5B beweist, dass Größe nicht alles ist
arXiv – cs.LG
•
The Virtues of Brevity: Avoid Overthinking in Parallel Test-Time Reasoning
arXiv – cs.AI
•
Sticker-TTS: Learn to Utilize Historical Experience with a Sticker-driven Test-Time Scaling Framework
arXiv – cs.AI
•
CoT-Space: A Theoretical Framework for Internal Slow-Thinking via Reinforcement Learning