MALinZero: Effiziente Low-Dimensional-Suche für komplexe Multi-Agenten-Planung
Monte‑Carlo‑Tree‑Search (MCTS) hat sich als leistungsstarkes Werkzeug für die Lösung komplexer Planungsaufgaben etabliert, indem es die Upper Confidence Bound for Trees (UCT) nutzt, um Exploration und Exploitation zu balancieren. In Multi‑Agenten‑Planung stößt MCTS jedoch auf ein enormes combinatorisches Aktionsraumproblem: die Anzahl möglicher Aktionskombinationen wächst exponentiell mit der Agentenzahl, was zu einem exponentiell steigenden Zweigfaktor führt und die effiziente Suche stark erschwert.