SCALAR-Benchmark prüft Halluzinationen und Konsistenz in Material-ML-Modellen
Wissenschaftler haben ein neues Benchmark namens SCALAR entwickelt, das die Leistungsfähigkeit von Sprachmodellen in der Materialwissenschaft genauer untersucht. SCALAR bewertet, wie gut Modelle geometrische Strukturen…