ICPRL: VLMs lernen physikalische Intuition durch interaktive Kontrolle
Vision‑Language‑Modelle (VLMs) sind bislang vor allem bei statischer Bildanalyse stark, doch sie stoßen an ihre Grenzen, wenn es um interaktive Entscheidungsfindung in dynamischen physikalischen Räumen geht. Dort erford…