Forschung
Neues Bandit-Modell: Anreize für unendliche Arme mit Lipschitz-Optimierung
Forscher haben ein neues Bandit-Modell vorgestellt, das die Herausforderung unendlich vieler Optionen in kontinuierlichen Metrikräumen adre…
arXiv – cs.LG