Forschung
Neues ERI-Benchmark: 57.750 Aufgaben für Ingenieur-LLMs
Ein brandneues Benchmark-Dataset namens Engineering Reasoning and Instruction (ERI) wurde veröffentlicht, das speziell dafür entwickelt wur…
arXiv – cs.AI