Neue effiziente Algorithmen für Blackwell‑optimale Politiken in MDPs
Markov‑Entscheidungsprobleme (MDPs) bilden die Basis für die Modellierung von sequentiellen Entscheidungen in vielen Bereichen. Traditionelle Optimierungskriterien wie diskontierte oder durchschnittliche Belohnungen ha…