Forschung
Neue Methode CHDP optimiert hybride Aktionsräume in Reinforcement Learning
In der Robotik und im Game‑AI wird häufig ein hybrider Aktionsraum eingesetzt, der aus diskreten Entscheidungen und kontinuierlichen Parame…
arXiv – cs.AI