MARL koordiniert heterogene Satellitencluster für autonome Erdbeobachtung
In einer wegweisenden Studie aus dem arXiv-Repository wird gezeigt, wie Multi‑Agent Reinforcement Learning (MARL) die Ressourcenoptimierung in heterogenen Satellitenclustern revolutioniert. Dabei arbeiten zwei optische und ein Synthetic Aperture Radar (SAR) Satellit gemeinsam im niedrigen Erdorbit, um Erdbeobachtungsziele zu erfassen und gleichzeitig ihre begrenzten Energie‑ und Speicherkapazitäten effizient zu nutzen.
Traditionelle Optimierungsansätze stoßen bei Echtzeit‑Operationen, Unsicherheiten und dezentralen Entscheidungsprozessen an ihre Grenzen. MARL bietet hier die nötige Flexibilität, indem es Agenten erlaubt, sich an veränderte Bedingungen anzupassen und gleichzeitig koordiniert zu handeln. Die Autoren modellieren das Problem systematisch von Einzel‑ zu Mehragentenszenarien und berücksichtigen dabei Energie‑, Speicher‑ und Beobachtungsbeschränkungen sowie die Heterogenität der Payloads.
Mit einer nahezu realistischen Simulationsumgebung, die auf den Basilisk‑ und BSK‑RL‑Frameworks basiert, wurden führende MARL‑Algorithmen wie MAPPO, HAPPO und HATRPO evaluiert. Die Ergebnisse zeigen, dass die Agenten erfolgreich zusammenarbeiten, Bildqualität und Ressourcennutzung ausbalancieren und gleichzeitig die Herausforderungen von Nicht‑Stationarität und interagenten‑abhängigen Belohnungen meistern.
Die Arbeit liefert wertvolle Einblicke für die Entwicklung skalierbarer, autonomer Erdbeobachtungsmissionen und legt eine solide Basis für zukünftige Forschungen im Bereich intelligenter Missionsplanung unter heterogenen und dynamischen Bedingungen.