Adaptive Test‑Time‑Reasoning mit zweiphasiger Suche steigert Genauigkeit und Effizienz
Neues Forschungspapier von Forschern auf arXiv zeigt, wie große Sprachmodelle (LLMs) ihre Leistung bei Rechen‑ und Codeaufgaben deutlich verbessern können. Durch die Einführung einer zweiphasigen Testzeit‑Skalierung werden die Schritte des Denkprozesses in Planung und Ausführung getrennt, wodurch die Suche gezielter und effizienter wird.