Aspiration-basierte Automata stabilisieren Spiele mit verrauschten Nutzenmessungen
In einem neuen Beitrag auf arXiv wird ein innovatives Lernverfahren vorgestellt, das die Grenzen herkömmlicher Verstärkungslernalgorithmen in verteilten Mehrspieler‑Spielen überwindet. Das Verfahren, genannt Aspiration‑Based Perturbed Learning Automata (APLA), kombiniert die klassische Verstärkung von Aktionen mit einem Aspiration‑Faktor, der die Zufriedenheit des Spielers widerspiegelt.