Forschung
LemmaBench: Live-Benchmark für LLMs in der mathematischen Forschung
Forscher haben ein neues Benchmark-Tool namens LemmaBench vorgestellt, das die Leistungsfähigkeit von großen Sprachmodellen (LLMs) in der m…
arXiv – cs.AI