Neues Benchmark FrontierScience prüft KI in Expertenwissenschaften
Die Wissenschafts-Community hat ein neues Benchmark namens FrontierScience vorgestellt, das die Fähigkeit von Sprachmodellen auf Expertenniveau in der wissenschaftlichen Forschung testet. Während aktuelle Tests oft Mult…