Neuer Algorithmus GPOMDP optimiert POMDP-Strategien direkt
In einer kürzlich veröffentlichten Arbeit auf arXiv wird ein innovativer Ansatz zur direkten Optimierung von Politikleistungen in kontrollierten POMDPs vorgestellt. Der Autor präsentiert GPOMDP, einen REINFORCE‑ähnliche…