PSRO ohne Spielsimulation: Neue Methode reduziert Rechenaufwand drastisch
Die Policy Space Response Oracles (PSRO) kombinieren spieltheoretische Gleichgewichtssuche mit maschinellem Lernen und sind damit ein leistungsstarkes Werkzeug zur Annäherung an Nash-Gleichgewichte in Nullsummenspielen. In der Praxis wird ihre Anwendung jedoch durch hohe Rechenkosten eingeschränkt, wobei die Spielsimulation den größten Aufwand verursacht.