Forschung
BRIDGE: KI‑Modelle schätzen menschliche Aufgabendauer exakt
Um die Leistungsfähigkeit von KI-Systemen realistisch zu bewerten, muss die Benchmark‑Performance in nachvollziehbare menschliche Maße über…
arXiv – cs.AI