Stochastische Belohnungsmaschinen: Neues Lernverfahren für RL
In der Forschung zu Reinforcement Learning (RL) sind Belohnungsmaschinen ein bewährtes Werkzeug, um Probleme mit seltenen und komplexen Belohnungen zu lösen. Bisher gingen die meisten Algorithmen jedoch davon aus, dass…