Forschung
CADENT: Gated Hybrid Distillation erhöht Sample‑Effizienz im RL um bis zu 60 %
Die hohe Sample‑Komplexität von Deep Reinforcement Learning (RL) bleibt ein zentrales Hindernis für die praktische Anwendung. Transferlerne…
arXiv – cs.LG