ObjectZero: Objektzentrierte Modelle kombinieren GNNs mit Monte-Carlo-Baum-Suche
In einer wegweisenden Veröffentlichung stellt das Forschungsteam den Reinforcement‑Learning‑Algorithmus ObjectZero vor, der die Welt in einzelne Objekte zerlegt und deren Interaktionen mithilfe von Graph Neural Networks (GNNs) modelliert. Durch diese objektzentrierte Sichtweise kann das System komplexe, dynamische Umgebungen viel präziser erfassen als herkömmliche Ansätze, die die Welt als ein einziges, unstrukturiertes Bild betrachten.
ObjectZero wurde in einer anspruchsvollen Testumgebung trainiert, die zahlreiche interaktive Objekte enthielt. Das Ergebnis zeigt, dass das Modell nicht nur die Dynamik einzelner Objekte zuverlässig vorhersagen kann, sondern auch die Wechselwirkungen zwischen ihnen versteht. Diese Fähigkeit macht es möglich, ein strukturiertes Weltmodell in ein modellbasiertes RL‑System zu integrieren.
Der entscheidende Schritt ist die Kombination des objektzentrierten Modells mit Monte‑Carlo Tree Search als Planungsmodul. Dadurch kann ObjectZero gezielt Entscheidungen treffen, indem es mögliche Zukunftsszenarien simuliert und die vielversprechendsten Handlungssequenzen auswählt. Die Studie demonstriert damit, dass strukturierte, objektbasierte Weltmodelle erfolgreich in moderne RL‑Frameworks eingebettet werden können, um sowohl Lernen als auch Planung zu optimieren.