Market-Bench: LLMs im Wirtschaftsspiel – ihre Handelsfähigkeiten werden getestet
Ein neues Benchmarking-Tool namens Market-Bench untersucht, wie gut große Sprachmodelle (LLMs) wirtschaftliche Aufgaben bewältigen können. Dabei wird die Fähigkeit der Modelle gemessen, Ressourcen zu verwalten und in ei…