Online‑Aktionsstapelung steigert Reinforcement‑Learning‑Leistung im Flugverkehr
Forscher haben eine neue Technik namens Online‑Aktionsstapelung entwickelt, die Reinforcement‑Learning‑Agenten ermöglicht, realistische Flugverkehrskontrollbefehle zu erzeugen, obwohl sie nur mit einer sehr kleinen disk…