A$^2$-LLM: End-to-End Audio-Avatar mit emotionaler Mimik in Echtzeit
Die Forschung im Bereich digitaler Menschen hat einen bedeutenden Fortschritt erzielt: Das neue Modell A$^2$-LLM verbindet Sprache, Audio‑Prosodie und 3D‑Gesichtsmotion in einem einzigen, end‑to‑end-System. Dadurch entf…