Forschung
Neuer Algorithmus liefert optimale Sample-Komplexität für robuste Offline-MARL
In der schnell wachsenden Welt des Multi‑Agenten‑Reinforcement Learning (MARL) stellt die Robustheit von Strategien im Angesicht von Umwelt…
arXiv – cs.LG