MPCM-Net: Multi‑Netzwerk mit Partial‑Attention & Mamba für Wolkensegmentierung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Die präzise Segmentierung von Wolkenbildern aus Bodenstationen ist ein entscheidender Schritt für die Vorhersage der Photovoltaikleistung. Traditionelle Deep‑Learning‑Ansätze konzentrieren sich vor allem auf Encoder‑Decoder‑Architekturen, nutzen jedoch häufig dilatierte Convolutionen, die nicht die volle Feature‑Effizienz und Interoperabilität von Kanal‑interagierenden Modulen bieten. Außerdem führen attention‑basierte Verbesserungen oft zu einem ungünstigen Kompromiss zwischen Genauigkeit und Durchsatz, während Decoder‑Modifikationen die globale Abhängigkeit zwischen hierarchischen lokalen Merkmalen vernachlässigen.

Um diese Schwächen zu überwinden, präsentiert das neue MPCM‑Netzwerk eine Multi‑Skalen‑Architektur, die Partial‑Attention‑Convolutionen mit der Mamba‑Struktur kombiniert. Im Encoder wird ein MPAC‑Block eingesetzt, der über ParCM und ParSM globale räumliche Interaktionen zwischen Wolkenformationen unterschiedlicher Skalen ermöglicht. Der MPA‑Block, bestehend aus ParAM und ParSM, extrahiert diskriminierende Merkmale bei gleichzeitig reduzierter Rechenkomplexität.

Der Decoder nutzt ein M2B‑Modul, das durch eine SSHD‑Schicht kontextuelle Verluste ausgleicht. Diese Schicht behält eine lineare Komplexität bei und erlaubt eine tiefe Aggregation von Merkmalen über räumliche und skalare Dimensionen. Das Ergebnis ist eine deutlich verbesserte Segmentierungsgenauigkeit bei gleichzeitig höherer Effizienz.

Als bedeutenden Beitrag zur Community wird zudem der neue CSRC‑Datensatz vorgestellt. Dieser enthält umfangreiche Bodenwolkenbilder mit hochauflösenden Annotationsmarkierungen und bietet Forschern eine robuste Grundlage, um die Leistungsfähigkeit von MPCM‑Netzwerken weiter zu evaluieren und zu optimieren.

Ähnliche Artikel