Forschung
Neue Erkenntnisse: Logarithmischer Regret in Zero‑Sum‑Spielen mit Bandit‑Feedback
In einer kürzlich veröffentlichten Arbeit auf arXiv (2602.06348v1) zeigen die Autoren, wie man in Nullsummenspielen mit Bandit‑Feedback – a…
arXiv – cs.LG