RC2: Durch zirkuläres Reinforcement Learning wird multimodales Denken verbessert
Robuste Wahrnehmung und logisches Denken erfordern, dass ein Modell über alle Sinnesmodalitäten hinweg konsistent bleibt. In der Praxis liefern multimodale Systeme jedoch häufig widersprüchliche Vorhersagen – etwa unter…