Agent lernt in Echtzeit-Action‑RPGs neue Fähigkeiten durch gezielte Skill‑Graphen
In der Forschung zu lebenslangen KI-Agenten steht die Herausforderung im Vordergrund, dass diese Agenten ihre Kompetenz kontinuierlich erweitern, ohne von Grund auf neu zu lernen oder bereits erworbene Verhaltensweisen zu verlieren. Ein aktuelles Experiment nutzt das Echtzeit‑Action‑RPG Dark Souls III, um diese Idee in einer anspruchsvollen Steuerungsumgebung zu testen.
Die Lösung besteht darin, den Kampf als gerichteten Skill‑Graphen darzustellen und die einzelnen Komponenten in einem hierarchischen Curriculum zu trainieren. Dadurch wird die Kontrolle in fünf wiederverwendbare Fähigkeiten zerlegt: Kamerasteuerung, Ziel‑Lock‑On, Bewegung, Ausweichen und eine Heilen‑Angreifen‑Entscheidungspolitik. Jede dieser Fähigkeiten wird gezielt für eine eng umrissene Aufgabe optimiert.
Durch diese Faktorisierung wird die Stichprobeneffizienz deutlich verbessert, weil die Last nicht mehr auf einer einzigen Policy liegt. Außerdem ermöglicht das System eine selektive Nachanpassung: Wenn sich die Umgebung von Phase 1 zu Phase 2 ändert, müssen lediglich ein Teil der Fähigkeiten angepasst werden, während die übergeordneten Fähigkeiten weiterhin übertragbar bleiben.
Experimentelle Ergebnisse zeigen, dass ein gezieltes Feintuning von nur zwei Fähigkeiten die Leistung unter einem begrenzten Interaktionsbudget schnell wiederherstellen kann. Diese Erkenntnisse deuten darauf hin, dass Skill‑Graph‑Curricula in Kombination mit selektivem Feintuning einen praktikablen Weg für sich entwickelnde, kontinuierlich lernende Agenten in komplexen Echtzeit‑Umgebungen darstellen.