Neuer Deep SOR Minimax Q-Learning beschleunigt Zwei-Spieler Nullsummenspiele
In der Welt der spieltheoretischen Algorithmen hat ein neues Verfahren die Messlatte höher gelegt: Der Deep SOR Minimax Q‑Learning-Algorithmus kombiniert die Vorteile der Successive Over‑Relaxation (SOR) mit tiefen neuronalen Netzen, um Zwei‑Spieler‑Nullsummenspiele effizienter zu lösen.