Neues chinesisches Dataset MSLR testet juristische Mehrschritt-Logik von LLMs
Large Language Models (LLMs) haben in den letzten Jahren beeindruckende Fortschritte im Bereich des logischen Denkens erzielt. Dennoch bleiben juristische Benchmarks oft unvollständig, weil sie Faktenabruf mit echter Sc…