Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Varianzreduktion”
Forschung

<p>Effiziente Varianzreduktion verbessert Wertbasierte Prozessverifikatoren</p> <p>Große Sprachmodelle (LLMs) haben in vielen Bereichen beeindruckende Erfolge erzielt, doch ihre Fähigkeit, komplexe Aufgaben wie Mathematik zu lösen, bleibt ein zentrales Problem. Wertbasierte Prozessverifikatoren, die die Wahrscheinlichkeit abschätzen, dass ein Teil einer Argumentationskette zum korrekten Ergebnis führt, gelten als vielversprechende Lösung. Ihre Wirksamkeit wird jedoch häufig durch Schätzfehler in den Trainin

arXiv – cs.AI