Neues Arbitration-Control für DQN-Ensembles verbessert kontinuierliches RL
Ein neues Verfahren namens ACED‑DQN (Arbitration Control for an Ensemble of Diversified DQN variants) wurde auf arXiv veröffentlicht und verspricht, das Problem des „catastrophic forgetting“ in Deep‑Reinforcement‑Learni…