GAUSS: Neues Benchmark für strukturierte Mathematikfähigkeiten von LLMs
Mit dem neuen Benchmark GAUSS (General Assessment of Underlying Structured Skills in Mathematics) setzen Forscher einen Meilenstein in der Bewertung der mathematischen Kompetenzen großer Sprachmodelle. GAUSS analysiert…