Forschung
R2-Dreamer: Schnelleres, Decoder‑Freies MBRL ohne Datenaugmentation
Ein neuer Beitrag auf arXiv (2603.18202v1) stellt R2‑Dreamer vor – ein Modell‑basierter Reinforcement‑Learning‑Ansatz, der ohne Decoder und…
arXiv – cs.LG