Neues Maß für Gedächtnisverbrauch in Reinforcement Learning
In einer kürzlich veröffentlichten Arbeit auf arXiv wird ein neues, modellunabhängiges Messinstrument namens Temporal Range vorgestellt, das genau angibt, wie stark ein trainiertes Reinforcement-Learning‑Agent vergangen…