Forschung
SAM steigert Robustheit von Offline-RL bei Datenkorruption
Offline-Reinforcement-Learning (RL) ist in der Praxis stark anfällig für Datenkorruption. Selbst die bislang robustesten Algorithmen scheit…
arXiv – cs.LG