BiTAgent: Aufgabenorientierter Rahmen für bidirektionale LLM-Weltmodell-Kopplung
BiTAgent ist ein neu entwickeltes Framework, das multimodale große Sprachmodelle (MLLMs) und Weltmodelle (WMs) miteinander verbindet, um generalistische, eingebettete Agenten zu schaffen. Das System löst zwei zentrale Probleme: die präzise Kopplung von semantischem Intent aus den MLLMs mit dynamischen Zustandsdarstellungen im latenten Raum des WMs und die anpassungsfähige, auf Aufgaben ausgerichtete Lernfähigkeit über verschiedene Umgebungen hinweg.