Neues RL-Framework: Risiko-sensitives Lernen mit Expectiles, Shortfall und OCE
In einer kürzlich veröffentlichten Arbeit auf arXiv wird ein neues Framework für risiko-sensitives Reinforcement Learning vorgestellt, das drei zentrale Risikomaße – Expectiles, utility‑basierte Shortfall‑Risiken und da…