MoNaCo: 1.315 komplexe, zeitintensive Fragen testen LLMs
Large Language Models (LLMs) sind inzwischen das bevorzugte Werkzeug, um Informationen abzufragen. Doch die meisten bestehenden Benchmarks enthalten kaum echte, natürliche Fragen, die für Menschen wirklich zeitaufwendig…