Feudal Q-Learning: Konvergenz und Stabilität in Hierarchischem RL nachgewiesen
Eine neue Veröffentlichung auf arXiv präsentiert Feudal Q‑Learning, ein hierarchisches Reinforcement‑Learning‑Verfahren, das nun mit soliden theoretischen Garantien ausgestattet ist. Durch die Kombination von Stochastic…