Deep Reinforcement Learning steuert Raumfahrzeug-Ausrichtung trotz Sperrzone

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer wegweisenden Studie wird Deep Reinforcement Learning (DRL) eingesetzt, um die Ausrichtung von Raumfahrzeugen präzise zu steuern, selbst wenn eine Sperrzone für die Ausrichtung vorgegeben ist. Der Ansatz nutzt den Soft Actor-Critic (SAC)-Algorithmus, der sich besonders gut für kontinuierliche Zustands- und Aktionsräume eignet.

Ein zentrales Merkmal der Arbeit ist die Entwicklung einer neuen Zustandsdarstellung, die die Sperrzone kompakt in die Entscheidungsfindung einbezieht. Gleichzeitig wird die Belohnungsfunktion so gestaltet, dass sie das Kontrollziel erreicht und gleichzeitig die Ausrichtungseinschränkung strikt einhält.

Zur Schulung des Agenten wird ein Curriculum-Learning-Ansatz verwendet, der die Lernschwierigkeiten schrittweise erhöht. Simulationen zeigen, dass das DRL-basierte Verfahren die geforderte Ausrichtung unter Berücksichtigung der Sperrzone zuverlässig realisiert und damit einen vielversprechenden Ansatz für zukünftige Raumfahrtmissionen darstellt.

Ähnliche Artikel