Neuer Transformer für Offline RL: Präzise Zielausrichtung bei gewünschter Rendite
Offline-Reinforcement-Learning hat in den letzten Jahren bemerkenswerte Fortschritte in Bereichen wie Robotik, autonomem Fahren und medizinischer Entscheidungsfindung erzielt. Dabei konzentrieren sich die meisten Ansätz…