WildSci: Neue Datenbank für wissenschaftliches LLM‑Reasoning
In den letzten Jahren haben große Sprachmodelle (LLMs) vor allem in Bereichen wie Mathematik und Programmierung enorme Fortschritte gemacht – dank reichlich hochwertiger Daten und klarer Bewertungskriterien. In wissenschaftlichen Feldern wie Medizin oder Materialwissenschaften hingegen bleibt die Entwicklung von LLM‑Reasoning-Modellen hinter den Erwartungen zurück, weil die Datenlage begrenzt ist und die Fragen oft komplex und offen sind.