Neuer Ansatz liefert nahezu optimalen Regret für verteilte adversariale Banditen
Ein kürzlich veröffentlichtes Papier auf arXiv präsentiert einen Durchbruch im Bereich der verteilten adversarialen Banditen. Dabei arbeiten N Agenten zusammen, um den globalen durchschnittlichen Verlust zu minimieren…