AVERE: Emotionserkennung in Audio-Video-Daten durch Präferenzoptimierung
Emotionserkennung ist ein entscheidender Baustein für sozial intelligente Agenten. Trotz der beeindruckenden Leistungen multimodaler Large Language Models (MLLMs) bleiben zwei zentrale Probleme bestehen: die Tendenz, Em…