Adaptive Rewards schaden: Warum statische Gewichte LEO‑Satelliten besser sind
Eine neue Untersuchung auf arXiv zeigt, dass adaptive Belohnungsgewichte bei der Deep‑Reinforcement‑Learning‑Optimierung von Multi‑Beam‑LEO‑Satelliten nicht immer die erwartete Leistung bringen. Stattdessen erzielen nah…