Neue Theorie erklärt und verbessert Testzeit‑Skalierung bei LLMs
In einer wegweisenden Studie wird erstmals ein theoretisches Fundament für die gängige Praxis der Testzeit‑Skalierung bei großen Sprachmodellen (LLMs) gelegt. Dabei konzentriert sich die Forschung auf sampling‑basierte Verfahren, die während der Inferenz mehrere Denkpfade erzeugen, um die Rechenleistung gezielt zu nutzen.