Forschung
Neues Arbitration-Control für DQN-Ensembles verbessert kontinuierliches RL
Ein neues Verfahren namens ACED‑DQN (Arbitration Control for an Ensemble of Diversified DQN variants) wurde auf arXiv veröffentlicht und ve…
arXiv – cs.LG