Selbstgesteuertes Curriculum verbessert Robustheit in Reinforcement Learning
In der Verstärkungslern‑Forschung ist es ein zentrales Problem, dass Agenten, die in kontrollierten Umgebungen trainiert werden, bei der Ausführung in der realen Welt häufig versagen. Die neue Methode Verteilungsrobustes selbstgesteuertes Curriculum‑Verstärkungslernen (DR‑SPCRL) löst dieses Problem, indem sie die Robustheitsgrenze als fortschreitendes Lernprogramm behandelt.