EgoIllusion: Benchmark deckt Halluzinationen von Modellen in Ego‑Videos auf
Multimodale große Sprachmodelle (MLLMs) haben in den letzten Jahren beeindruckende Fortschritte bei komplexen multimodalen Aufgaben erzielt. Sie sind besonders stark in der visuellen Wahrnehmung und im logischen Denken…