FraPPE: Schnelle Präferenz-basierte Exploration für Pareto-Optimale Arms
Auf dem arXiv wurde ein neuer Algorithmus namens FraPPE vorgestellt, der die Präferenz-basierte Pure Exploration (PrePEx) in Mehrzielbanditen revolutioniert. Ziel von PrePEx ist es, mit einer vorgegebenen Konfidenz die…