Neues Framework verbindet KI‑Benchmarks zu einer einheitlichen Skala
Wissenschaftler haben ein neues statistisches Modell entwickelt, das verschiedene KI‑Benchmarks zu einer einzigen, vergleichbaren Skala zusammenführt. Durch diese „Rosetta‑Stone“-Lösung können die Leistungsfähigkeit von Modellen und die Schwierigkeit von Tests auf einer gemeinsamen numerischen Basis bewertet werden.