Weltmodelle als Brücke: Agenten meistern kostenintensive Aufgaben
In den letzten Jahren haben große Sprachmodelle (LLMs), die mit Reinforcement Learning trainiert wurden, in Spielen, Mathematikaufgaben und Programmieraufgaben eine übermenschliche Leistung gezeigt. Diese Erfolge lassen…