Forschung
Stochastische Belohnungsmaschinen: Neues Lernverfahren für RL
In der Forschung zu Reinforcement Learning (RL) sind Belohnungsmaschinen ein bewährtes Werkzeug, um Probleme mit seltenen und komplexen Bel…
arXiv – cs.AI