Neues MARL-Studie: Nicht-monotone Faktorisierung übertrifft monotone Ansätze
Eine neue Veröffentlichung auf arXiv beleuchtet die Prinzipien der Wertdekomposition in Multi-Agent Reinforcement Learning (MARL) und zeigt, dass nicht-monotone Ansätze die bisher dominierenden monotone Methoden übertre…