RPM-MCTS: Wissensabfrage Prozessbelohnung Monte-Carlo-Baum-Suche verbessert Code
Die Nutzung von Baum-Suchverfahren hat die Fähigkeit großer Sprachmodelle zur Codegenerierung deutlich gesteigert. Dennoch bleiben die Bewertung von Zwischenschritten und die rechtzeitige Korrektur von Fehlern problemat…