Neue Methode ermöglicht gezielte Steuerung von Agenten in Markov-Prozessen
Forscher haben ein neues Verfahren entwickelt, das es ermöglicht, Agenten in Markov-Entscheidungsprozessen gezielt zu steuern, ohne dass sie neu trainiert werden müssen. Das Konzept basiert darauf, dass jede Policy durc…