Forschung
Agenten bevorzugen sichere, niedrige Belohnungen bei Mehrfachlehrern
In einer neuen Studie auf arXiv wurde ein überraschendes Verhalten von Lernagenten im Bereich des interaktiven Reinforcement Learning (IRL)…
arXiv – cs.AI