Benchmark VECTOR zeigt Schwächen Video-Modelle – MECOT verbessert Zeitverständnis
In einer neuen Studie von Forschern aus dem Bereich der multimodalen Videoanalyse wird deutlich, dass aktuelle Video‑Large‑Multimodal‑Modelle (VLMMs) zwar beeindruckende Leistungen bei der allgemeinen Video‑Verständnisa…