Neuer Ansatz für risikosensitives Q‑Learning in kontinuierlicher Zeit
Ein neues arXiv‑Veröffentlichung beleuchtet die Herausforderung des risikosensitiven Reinforcement Learning (RSRL) in kontinuierlicher Zeit. Dabei wird die Umgebung durch eine steuerbare stochastische Differentialgleich…