Forschung
Action Shapley: Neue Metrik für effiziente Trainingsdatenauswahl in RL
In vielen Offline‑ und modellbasierten Reinforcement‑Learning‑Systemen kommen World‑Models zum Einsatz, um die zugrunde liegenden Umgebunge…
arXiv – cs.LG