Forschung
FunPRM: LLM-Codegenerierung mit Funktionsschritten und Meta‑Belohnungskorrektur
Die neue Methode FunPRM (Function‑as‑Step Process Reward Model) löst ein langjähriges Problem bei der Codegenerierung mit großen Sprachmode…
arXiv – cs.LG