Forschung
Offline RL: Skalierbare Modellbasierte Lernmethode mit Aktionsblöcken
Ein neues Verfahren namens Model-Based RL with Action Chunks (MAC) zeigt, dass modellbasiertes Reinforcement Learning auch bei sehr großen…
arXiv – cs.LG