Forschung
Neue Flow‑Matching‑Methode für Offline‑RL mit diskreten Aktionen
Forscher haben Flow Matching auf diskrete Aktionsräume ausgeweitet, um Offline‑Reinforcement‑Learning in breiteren Szenarien zu ermöglichen…
arXiv – cs.LG