DEVAL: Framework zur Messung und Verbesserung der Ableitungsfähigkeit von LLMs
Die Autoren stellen DEVAL vor, ein systematisches Evaluationsframework, das die Fähigkeit von großen Sprachmodellen (LLMs) misst, logische Ableitungen aus Eingabedaten zu ziehen. Durch die Definition der Derivation Rela…