KI News: Kurz und klar.

Anmelden

Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning

arXiv – cs.LG • 20.10.2025 05:00 • Original

#Behavior Cloning #Flow Policy #Optimal Transport #Jordan-Kinderlehrer-Otto #Entropic Regularization #Wasserstein #Online Adaptation

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 10.02.2026 05:00

AR-basierte Ferninteraktion beschleunigt lernende, zügige Robotik

arXiv – cs.LG • 09.02.2026 05:00

Tempora: Neue Bewertungsplattform für Echtzeit-Adaptation von ML-Modellen

arXiv – cs.LG • 06.02.2026 05:00

ReFORM: Flow-basierte Offline RL ohne OOD-Fehler – neue Rekordleistung

arXiv – cs.LG • 05.02.2026 05:00

Neues Verfahren: Noise Annealing in Semi-Dual Neural OT

MarkTechPost • 04.02.2026 04:49

Offline-Training von sicherheitskritischen RL-Agenten mit Conservative Q‑Learning

arXiv – cs.LG • 02.02.2026 05:00

Neue Messgröße: Relative Wasserstein-Winkel liefert bessere Gauß-Approximation