Offline MORL optimiert Entscheidungen im Intensivbereich
In der Intensivmedizin stehen Ärzte vor der schwierigen Aufgabe, die Lebensrettung eines Patienten mit dem effizienten Einsatz von Ressourcen wie der Aufenthaltsdauer abzugleichen. Traditionelle Reinforcement‑Learning‑Ansätze lösen dieses Problem meist mit einer festen, skalarisierten Belohnungsfunktion, was zu starren Richtlinien führt, die sich nicht an unterschiedliche klinische Prioritäten anpassen lassen.