Forschung
SCALAR-Benchmark prüft Halluzinationen und Konsistenz in Material-ML-Modellen
Wissenschaftler haben ein neues Benchmark namens SCALAR entwickelt, das die Leistungsfähigkeit von Sprachmodellen in der Materialwissenscha…
arXiv – cs.LG