Neue Aufgabe ARCHE prüft, ob KI echte wissenschaftliche Argumente versteht
Wissenschaftler haben eine neue Herausforderung für große Sprachmodelle (LLMs) entwickelt, die die Tiefe des logischen Denkens in wissenschaftlichen Texten misst. Die Aufgabe, genannt Latent Reasoning Chain Extraction (…