Forschung
Budgetgestützte Erreichbarkeit für sichere Offline RL
In der Welt der sequentiellen Entscheidungsfindung, die auf Markov Decision Processes basiert, haben sowohl modellbasierte als auch modellf…
arXiv – cs.LG