Forschung
EgoIllusion: Benchmark deckt Halluzinationen von Modellen in Ego‑Videos auf
Multimodale große Sprachmodelle (MLLMs) haben in den letzten Jahren beeindruckende Fortschritte bei komplexen multimodalen Aufgaben erzielt…
arXiv – cs.AI