Forschung
Neuer Deep SOR Minimax Q-Learning beschleunigt Zwei-Spieler Nullsummenspiele
In der Welt der spieltheoretischen Algorithmen hat ein neues Verfahren die Messlatte höher gelegt: Der Deep SOR Minimax Q‑Learning-Algorith…
arXiv – cs.LG