Surya: Das erste Foundation‑Modell für Heliophysik – 366 Mio. Parameter
Heliophysik ist entscheidend für das Verständnis und die Vorhersage von Weltraumwetter und Sonnenaktivität. Trotz jahrzehntelanger hochauflösender Beobachtungen der Solar Dynamics Observatory (SDO) bleiben die meisten Modelle auf einzelne Aufgaben beschränkt und sind durch die Knappheit an gelabelten Daten stark eingeschränkt, was ihre Fähigkeit zur Generalisierung über verschiedene Sonnenphänomene hinweg begrenzt.
Wir stellen Surya vor, ein 366‑Millionen‑Parameter‑Foundation‑Modell, das darauf ausgelegt ist, allgemeine solarphysikalische Darstellungen aus den umfangreichen SDO‑Beobachtungen zu lernen. Surya nutzt acht Kanäle des Atmospheric Imaging Assembly (AIA) sowie fünf Produkte des Helioseismic and Magnetic Imager (HMI) und setzt auf eine spatiotemporale Transformer‑Architektur mit spektraler Gating‑Funktion und Long‑Short‑Range‑Attention. Durch ein spezielles Pre‑Training auf hochauflösenden Vorhersageaufgaben für Sonnenbilder und anschließende Optimierung mittels autoregressiver Rollout‑Tuning‑Methoden wird das Modell auf die komplexen Dynamiken der Sonne vorbereitet.
Die Zero‑Shot‑Evaluierungen zeigen, dass Surya in der Lage ist, Sonnenbewegungen und Flare‑Ereignisse vorherzusagen. Bei der Feinabstimmung mit der parameter‑effizienten Low‑Rank Adaptation (LoRA) erzielt das Modell herausragende Ergebnisse bei der Vorhersage des Sonnenwinds, der Segmentierung aktiver Regionen, der Flare‑Vorhersage und der Analyse von EUV‑Spektren.
Surya ist das erste Foundation‑Modell in der Heliophysik, das die Zeitfortschreibung als Pretextaufgabe auf Vollauflösungs‑SDO‑Daten nutzt. Seine innovative Architektur und die erzielten Leistungen deuten darauf hin, dass das Modell die zugrunde liegende Physik der Sonnenentwicklung erfassen kann.