Forschung
Zero-Shot-Transfer von RL-Policen dank Buckingham’s Pi-Theorem
Reinforcement‑Learning‑Modelle stoßen häufig an ihre Grenzen, wenn sie auf neue Roboter, Aufgaben oder Umgebungen mit veränderten physikali…
arXiv – cs.LG