Forschung
KI-Agenten: Wie gut spiegeln sie die reale Arbeitswelt wider?<br/><p>In einer neuen Studie von arXiv (2603.01203v1) wird untersucht, inwieweit die Entwicklung von KI-Agenten tatsächlich die Vielfalt und den Umfang menschlicher Arbeit abbildet. Die Forscher haben 43 Benchmarks und über 72.000 Aufgaben analysiert und diese mit den 1.016 realen US-Berufen verglichen. Dabei zeigte sich ein deutlicher Mismatch: Die meisten Benchmarks konzentrieren sich stark auf Programmieraufgaben, während die meisten Arbeitspl
arXiv – cs.AI