MORSE: Automatisches Reward‑Shaping für Multi‑Objective‑Umgebungen
In einer neuen Veröffentlichung auf arXiv wird das Framework MORSE vorgestellt, das die Gestaltung von Belohnungsfunktionen in Reinforcement‑Learning‑Systemen revolutioniert. MORSE kombiniert automatisch mehrere von Men…