SymPyBench: Dynamisches Benchmark für wissenschaftliches Denken mit Python-Code
Ein neues, umfangreiches Benchmarking-Set namens SymPyBench wurde vorgestellt, das 15.045 physikalische Aufgaben auf Universitätsniveau umfasst. Die Aufgaben sind vollständig parametrisiert, sodass unendlich viele Varia…