Forschung
MulFeRL: Verstärktes RL durch verbale Rückmeldungen in Mehrfachschleifen
Das neu veröffentlichte Verfahren MulFeRL kombiniert Verstärkendes Lernen mit strukturiertem verbalen Feedback, um die Leistungsfähigkeit v…
arXiv – cs.AI