Action Shapley: Neue Metrik für effiziente Trainingsdatenauswahl in RL
In vielen Offline‑ und modellbasierten Reinforcement‑Learning‑Systemen kommen World‑Models zum Einsatz, um die zugrunde liegenden Umgebungen zu simulieren. Gerade dort, wo direkte Interaktionen mit der realen Welt teuer…