CADENT: Gated Hybrid Distillation erhöht Sample‑Effizienz im RL um bis zu 60 %
Die hohe Sample‑Komplexität von Deep Reinforcement Learning (RL) bleibt ein zentrales Hindernis für die praktische Anwendung. Transferlernen soll dieses Problem lösen, doch bisherige Ansätze kämpfen mit der Domänenversc…