Cross‑Fitted Proximal Learning verbessert Modellbasiertes Reinforcement Learning
Modellbasiertes Reinforcement Learning (RL) gilt als besonders vielversprechend, weil es explizit Belohnungs‑ und Übergangsmuster erfasst und damit planbare Rollouts ermöglicht. In Offline‑Umgebungen, in denen Beobachtu…