HUMANSTUDY-BENCH: KI-Agenten simulieren menschliche Experimente zuverlässig
In der neuesten Veröffentlichung auf arXiv (2602.00685v1) wird ein neues Benchmark-System vorgestellt, das große Sprachmodelle (LLMs) als simulierte Teilnehmer in sozialwissenschaftlichen Experimenten einsetzt. Das Syst…