Neuer Deep SOR Minimax Q-Learning beschleunigt Zwei-Spieler Nullsummenspiele
In der Welt der spieltheoretischen Algorithmen hat ein neues Verfahren die Messlatte höher gelegt: Der Deep SOR Minimax Q‑Learning-Algorithmus kombiniert die Vorteile der Successive Over‑Relaxation (SOR) mit tiefen neur…