Forschung
SPAN: Benchmark für interkalenderische Zeitlogik von LLMs
Wissenschaftler haben SPAN ins Leben gerufen, ein neues Benchmark, das große Sprachmodelle (LLMs) dazu herausfordert, Zeitfragen über versc…
arXiv – cs.AI