KI News: Kurz und klar.

Anmelden

Variance-Aware Feel-Good Thompson Sampling for Contextual Bandits

arXiv – cs.LG • 05.11.2025 05:00 • Original

#Varianzabhängiges Regret #kontextuelle Banditen #Thompson Sampling #LinVDTS #FGTSVA #Decoupling-Koeffizient #Subgaussische Norm

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 30.01.2026 05:00

Effiziente Simple-Regret-Algorithmen für stochastische kontextuelle Banditen

arXiv – cs.LG • 22.01.2026 05:00

Hierarchische Kontext‑Uplift‑Bandits steigern Personalisierung von Katalogen

arXiv – cs.LG • 12.12.2025 05:00

Neue Gewichtungsstrategien verbessern Präferenzoptimierung von LLMs

arXiv – cs.AI • 04.12.2025 05:00

KI-Agenten in den Lebenswissenschaften: Echtzeit‑Optimierung mit RL

arXiv – cs.LG • 17.11.2025 05:00

Neue Bandit-Strategien für Edge-Inferenz: Konstanter Regret

arXiv – cs.LG • 16.10.2025 05:00

Thompson Sampling via Fine-Tuning of LLMs