AHELM: Neues Benchmark für Audio‑Sprachmodelle bewertet 10 Kernaspekte
Die Forschung zu Audio‑Language‑Models (ALMs) hat bisher an einheitlichen Messgrößen gelitten. Viele Tests konzentrieren sich nur auf wenige Fähigkeiten und vernachlässigen wichtige Aspekte wie Fairness oder Sicherheit…