Neue UCT-Strategien passen sich automatisch an Belohnungsmaßstab an
Der Upper Confidence Bounds For Trees (UCT)-Algorithmus ist nicht blind gegenüber der Belohnungsgröße, die in einem Spiel verwendet wird. Während bei Null‑Sum‑Spielen mit sparsamen Endbelohnungen wie –1, 0 oder 1 keine…