Forschung
Physikbasierte Belohnungsmaschinen beschleunigen Reinforcement Learning
Reward‑Machines (RMs) ermöglichen es, nicht‑Markovsche Belohnungen in Reinforcement‑Learning‑Systemen strukturiert zu definieren. Sie trenn…
arXiv – cs.LG