Test-Time Mixture of World Models verbessert Anpassungsfähigkeit von Agents
In der aktuellen Forschung werden Sprachmodell-basierte Embodied Agents immer häufiger in realen Umgebungen eingesetzt. Ihre Fähigkeit, sich an dynamische Szenarien anzupassen, bleibt jedoch begrenzt, weil die zugrunde liegenden Weltmodelle nicht flexibel genug sind. Um dieses Problem zu lösen, erweitert die neue Methode Test-Time Mixture of World Models (TMoW) das klassische Mixture-of-Experts-Paradigma, indem sie die Routenfunktion während der Inferenz anpasst.