Eikonal-Constrained Quasimetric RL: Zielerreichung ohne Trajektorien
In der Welt des zielbedingten Verstärkungslernens (GCRL) wird die Herausforderung der Belohnungsgestaltung durch die Umwandlung von Aufgaben in reine Zielerreichungsprobleme gemildert. Dabei entsteht von Natur aus ein…