Online-Anpassung von RL mit Echo State Networks bei nicht-stationären Dynamiken
Reinforcement‑Learning‑Agenten, die in simulierten Umgebungen trainiert werden, zeigen häufig erhebliche Leistungsabfälle, sobald sie in der realen Welt eingesetzt werden. Der Grund liegt in nicht‑stationären Dynamiken…