Zero-Shot-Transfer von RL-Policen dank Buckingham’s Pi-Theorem
Reinforcement‑Learning‑Modelle stoßen häufig an ihre Grenzen, wenn sie auf neue Roboter, Aufgaben oder Umgebungen mit veränderten physikalischen Parametern übertragen werden. Das neue Verfahren nutzt das klassische Buck…