Forschung
CHBench: Neues Benchmark für strategisches Denken von Sprachmodellen
Die Fähigkeit von Sprachmodellen, Spiele zu spielen, gilt als wichtiger Indikator für ihr strategisches Denkvermögen. Traditionelle Messgrö…
arXiv – cs.AI