Forschung
HUMANSTUDY-BENCH: KI-Agenten simulieren menschliche Experimente zuverlässig
In der neuesten Veröffentlichung auf arXiv (2602.00685v1) wird ein neues Benchmark-System vorgestellt, das große Sprachmodelle (LLMs) als s…
arXiv – cs.AI