Forschung
MePoly: Maximale Entropie mit Polynom-Policy-Optimierung
Ein neues Verfahren namens MePoly eröffnet einen vielversprechenden Ansatz für die Optimierung von Policies in der stochastischen Regelung…
arXiv – cs.LG