LLM-gestützte Planung mit Subgoal-Graphen verbessert Open-World RL
In einer neuen Studie wird gezeigt, wie große Sprachmodelle (LLMs) die Planung in Reinforcement-Learning-Umgebungen deutlich verbessern können. Der Ansatz nutzt die Fähigkeit von LLMs, komplexe Aufgaben in Teilziele zu…