Forschung
Eikonal-Constrained Quasimetric RL: Zielerreichung ohne Trajektorien
In der Welt des zielbedingten Verstärkungslernens (GCRL) wird die Herausforderung der Belohnungsgestaltung durch die Umwandlung von Aufgab…
arXiv – cs.LG