SATQuest: Neuer Verifizierer für logisches Denken in LLMs
Die jüngsten Fortschritte bei großen Sprachmodellen (LLMs) haben beeindruckende Fähigkeiten im logischen Denken gezeigt – doch die systematische Bewertung und Verbesserung dieser Fähigkeiten bleibt schwierig. Der neue A…