Forschung
Effiziente Aktionsauswahl in großen Aktionsräumen: Von Banditen zu MDPs
Wissenschaftler haben einen neuen Ansatz entwickelt, um aus riesigen Aktionsräumen eine kleine, aber repräsentative Teilmenge zu wählen. Di…
arXiv – cs.LG