Forschung
Neue Bandit-Algorithmen mit Gaussian‑Prior verbessern Lernregret
In einer kürzlich veröffentlichten Studie auf arXiv wird ein neuer Ansatz für Multi‑Armed Bandit‑Probleme vorgestellt, bei denen die Arm‑Be…
arXiv – cs.LG