Forschung
Feudal Q-Learning: Konvergenz und Stabilität in Hierarchischem RL nachgewiesen
Eine neue Veröffentlichung auf arXiv präsentiert Feudal Q‑Learning, ein hierarchisches Reinforcement‑Learning‑Verfahren, das nun mit solide…
arXiv – cs.LG