Neuer Algorithmus liefert optimale Sample-Komplexität für robuste Offline-MARL
In der schnell wachsenden Welt des Multi‑Agenten‑Reinforcement Learning (MARL) stellt die Robustheit von Strategien im Angesicht von Umweltunsicherheiten einen entscheidenden Erfolgsfaktor dar. Ein neues Forschungsergeb…