Forschung
Neuer Algorithmus VBE nutzt Ensemble-Fehler für optimistische Exploration im RL
In der Welt des Reinforcement Learning (RL) steht die gezielte Erkundung von bislang unbekannten Zuständen im Fokus. Der neu vorgestellte A…
arXiv – cs.AI