Forschung
VariBASeD: Bayessche Adaptive Monte-Carlo-Planung für Reinforcement Learning
Ein neuer Ansatz namens VariBASeD kombiniert variationales Lernen, sequentielles Monte-Carlo-Planen und Meta‑Reinforcement‑Learning, um Bay…
arXiv – cs.LG