A^3-Bench: Neuer Test für wissensbasierte wissenschaftliche Argumentation
Die Forschung im Bereich wissenschaftlicher Argumentation erhält mit dem neuen Benchmark A^3-Bench einen wichtigen Impuls. Während bisherige Tests vor allem die Endergebnisse oder die Kohärenz einzelner Schritte bewerte…