Forschung
BiCQL-ML: Bi-Level-Framework verbessert Offline-IRL ohne Policy-Lernen
Ein neuer Ansatz namens BiCQL-ML verspricht, die Offline-Inverse-Reinforcement-Learning (IRL)-Forschung auf ein neues Level zu heben. Dabei…
arXiv – cs.LG