FIBER: Mehrsprachiges Benchmark für Faktenprüfung in Sprachmodellen
Die neueste Studie aus dem arXiv-Repository (ArXiv:2512.11110v1) stellt FIBER vor – ein umfassendes, mehrsprachiges Benchmark, das die Faktenkenntnisse großer Sprachmodelle systematisch testet. Im Gegensatz zu bisherige…