BiCQL-ML: Bi-Level-Framework verbessert Offline-IRL ohne Policy-Lernen
Ein neuer Ansatz namens BiCQL-ML verspricht, die Offline-Inverse-Reinforcement-Learning (IRL)-Forschung auf ein neues Level zu heben. Dabei wird die klassische Herausforderung, aus statischen Demonstrationsdaten eine si…