Landmark-basierte Monte-Carlo-Planung verbessert probabilistische MDPs
In der klassischen Planung haben Landmarke – Bedingungen, die in jedem Lösungsplan erfüllt sein müssen – bereits große Fortschritte ermöglicht. Neu ist die Anwendung dieser Idee in stochastischen Entscheidungsprozessen. Forscher haben probabilistische Landmarke definiert und den bekannten UCT‑Algorithmus so angepasst, dass er diese Landmarke als Zwischenschritte nutzt, um Markov‑Entscheidungsprozesse (MDPs) zu zerlegen.