Effiziente Simple-Regret-Algorithmen für stochastische kontextuelle Banditen
Ein neuer Beitrag auf arXiv präsentiert die ersten effizienten Algorithmen, die im Bereich der stochastischen kontextuellen Banditen das Simple‑Regret‑Kriterium adressieren. Dabei liegt der Fokus auf logistischen Bandit…