Neues Bandit-Modell: Anreize für unendliche Arme mit Lipschitz-Optimierung
Forscher haben ein neues Bandit-Modell vorgestellt, das die Herausforderung unendlich vieler Optionen in kontinuierlichen Metrikräumen adressiert. Im Gegensatz zu klassischen Bandit-Ansätzen wird hier ein Entscheider –…