AVLLMs: Warum Audio im Text oft untergeht – neue Studie enthüllt Bias
Audio‑Visual Large Language Models (AVLLMs) gelten als vielversprechende Schnittstelle für multimodale Wahrnehmung. In einer ersten mechanistischen Analyse wurden die Abläufe von Audio‑ und Bilddaten durch die Schichten…