Zero-Shot-Transfer von RL-Policen dank Buckingham’s Pi-Theorem
Reinforcement‑Learning‑Modelle stoßen häufig an ihre Grenzen, wenn sie auf neue Roboter, Aufgaben oder Umgebungen mit veränderten physikalischen Parametern übertragen werden. Das neue Verfahren nutzt das klassische Buckingham‑Pi‑Theorem, um diese Hürde zu überwinden – und zwar ohne jegliches Retraining.