Forschung
Market-Bench: LLMs im Wirtschaftsspiel – ihre Handelsfähigkeiten werden getestet
Ein neues Benchmarking-Tool namens Market-Bench untersucht, wie gut große Sprachmodelle (LLMs) wirtschaftliche Aufgaben bewältigen können…
arXiv – cs.AI