Reinforcement‑Learning‑Ansatz optimiert Polar‑Codes für 6G

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Forschungsprojekt aus dem Bereich der 6G‑Kommunikation präsentiert einen Reinforcement‑Learning‑basierten Ansatz zur universellen Sequenzgestaltung von Polar‑Codes. Der entwickelte Rahmen ist erweiterbar und kann sich an unterschiedliche Kanalbedingungen sowie an verschiedene Decodierungsstrategien anpassen.

Besonders hervorzuheben ist die Skalierbarkeit des Modells: Es funktioniert zuverlässig für Code‑Längen bis zu 2048 Symbolen, was es für die Standardisierung in zukünftigen Mobilfunknetzen geeignet macht. In allen (N,K)-Konfigurationen, die im 5G‑Standard verwendet werden, erzielt die Methode eine Leistung, die mit der im 5G‑Netzwerk‑Standard (NR) eingesetzten Sequenz vergleichbar ist. Bei einer Code‑Länge von 2048 Symbolen erreicht sie sogar einen Gewinn von bis zu 0,2 dB gegenüber dem bisherigen Beta‑Expansion‑Baseline.

Die Erfolge des Ansatzes beruhen auf drei zentralen Innovationen: Erstens wird das Lernen durch physikalische Gesetze eingeschränkt, indem die universelle Teilordnung von Polar‑Codes genutzt wird. Zweitens wird die schwache langfristige Beeinflussung von Entscheidungen ausgenutzt, um die Notwendigkeit von Look‑ahead‑Bewertungen zu reduzieren. Drittens erfolgt die Optimierung gleichzeitig über mehrere Konfigurationen hinweg, was die Effizienz des Lernprozesses deutlich steigert.

Ähnliche Artikel