MICE: Reduziert Fehlverhalten in sicherheitskritischem Reinforcement Learning
Ein neues Verfahren namens MICE (Memory‑driven Intrinsic Cost Estimation) verspricht, die Sicherheit von Reinforcement‑Learning‑Systemen deutlich zu erhöhen. Durch die gezielte Kontrolle von Bias‑Fehlern in der Kostenwe…