Forschung
MICE: Reduziert Fehlverhalten in sicherheitskritischem Reinforcement Learning
Ein neues Verfahren namens MICE (Memory‑driven Intrinsic Cost Estimation) verspricht, die Sicherheit von Reinforcement‑Learning‑Systemen de…
arXiv – cs.LG