Forschung
DEVAL: Framework zur Messung und Verbesserung der Ableitungsfähigkeit von LLMs
Die Autoren stellen DEVAL vor, ein systematisches Evaluationsframework, das die Fähigkeit von großen Sprachmodellen (LLMs) misst, logische…
arXiv – cs.LG