Hierarchisches Lernen von Agenten: Effiziente Umgebungsgestaltung ohne Überwachung
Unsupervised Environment Design (UED) hat sich als vielversprechender Ansatz etabliert, um generalistische Agenten durch automatisierte Curriculum‑Generierung zu entwickeln. Traditionelle UED‑Methoden setzen stark auf Open‑Endedness, wobei Lehralgorithmen auf stochastische Prozesse angewiesen sind, um unendlich viele nützliche Umgebungen zu erzeugen. In ressourcenbeschränkten Szenarien, in denen die Interaktionsmöglichkeiten zwischen Lehrer und Schüler begrenzt sind, wird diese Annahme jedoch schnell unpraktisch.