Forschung
ACTOR-CURATOR: adaptives Curriculum steigert LLM-Post-Training
Ein neues Framework namens ACTOR-CURATOR verspricht, die Nachschulung großer Sprachmodelle mit Reinforcement Learning effizienter zu gestal…
arXiv – cs.LG