SolarGPT‑QA: Neues LLM für Lernfragen zu Sonnenwetter und Heliophysik

arXiv – cs.LG Original ≈2 Min. Lesezeit
Anzeige

Die Sonne kann mit Flare, koronalen Massenauswürfen und geomagnetischen Stürmen Satelliten, Flugzeuge, Stromnetze, Rechenzentren und Raumfahrtmissionen stark beeinträchtigen. Um wirtschaftliche Schäden zu vermeiden, ist eine frühzeitige Vorhersage und eine effektive Bildung in der Weltraumforschung entscheidend.

Große Sprachmodelle (LLMs) liefern zwar gute Ergebnisse bei allgemeinen Aufgaben, fehlen jedoch oft das fachspezifische Wissen und die didaktische Fähigkeit, komplexe Konzepte der Sonnenforschung verständlich zu erklären. Mit SolarGPT‑QA wird dieses Problem adressiert: ein Frage‑Antwort-System, das auf dem LLaMA‑3‑Modell basiert und speziell für die Bereiche Sonnenwetter und Heliophysik angepasst wurde.

Das Modell wurde mit wissenschaftlicher Literatur sowie mit umfangreichen Frage‑Antwort-Daten trainiert, die zunächst von GPT‑4 generiert und anschließend mit Grok‑3 in einem studentfreundlichen Erzählstil verfeinert wurden. Dadurch erhält SolarGPT‑QA die nötige Fachkompetenz und zugleich die pädagogische Klarheit, die Lernende benötigen.

In menschlichen Paarvergleichen übertrifft SolarGPT‑QA generische Modelle in Zero‑Shot-Szenarien und erreicht gleichzeitig eine Leistung, die mit instruction‑tuned Modellen für Bildungs‑Erklärungen vergleichbar ist. Eine kleine Pilotstudie unter Studierenden zeigte zudem, dass die Erklärungen des Modells klarer und zugänglicher sind. Ablationsstudien verdeutlichen, dass die Kombination aus domänenadaptivem Pre‑Training und pädagogischer Feinabstimmung entscheidend für die Balance zwischen wissenschaftlicher Genauigkeit und didaktischer Wirksamkeit ist.

Dieses Ergebnis markiert einen wichtigen ersten Schritt in Richtung eines umfassenderen SolarGPT‑Frameworks, das sowohl die Bildung als auch die Vorhersage in der Sonnenforschung unterstützen soll.

Ähnliche Artikel