Physikbasierte Belohnungsmaschinen beschleunigen Reinforcement Learning
Reward‑Machines (RMs) ermöglichen es, nicht‑Markovsche Belohnungen in Reinforcement‑Learning‑Systemen strukturiert zu definieren. Sie trennen das bereits Bekannte über die Umwelt – das Belohnungssystem – von dem, was no…