Forschung
Online‑Aktionsstapelung steigert Reinforcement‑Learning‑Leistung im Flugverkehr
Forscher haben eine neue Technik namens Online‑Aktionsstapelung entwickelt, die Reinforcement‑Learning‑Agenten ermöglicht, realistische Flu…
arXiv – cs.LG