Neues Fortschritts-Constraint für Reinforcement Learning in Behavior Trees
Behavior Trees (BTs) bieten ein strukturiertes und reaktives Entscheidungsframework, das häufig eingesetzt wird, um zwischen Untersteuerungen je nach Umweltbedingungen zu wechseln. Reinforcement Learning (RL) hingegen kann nahezu optimale Steuerungen erlernen, hat jedoch oft Probleme mit spärlichen Belohnungen, sicherer Exploration und der Zuordnung von langfristigen Erfolgen.