Hierarchisches RL‑MPC: Adaptive Planung steigert Effizienz um 72 %
Ein neues Verfahren verbindet hierarchische Reinforcement‑Learning‑Aktionen mit Model Predictive Control (MPC) und schafft so eine elegante, eng gekoppelte Planungslösung. Durch die Nutzung von RL‑Aktionen zur Steuerung des MPPI‑Samplers und die adaptive Aggregation von MPPI‑Samples zur Wertschätzung wird ein dynamischer Prozess erzeugt, der gezielt dort mehr Exploration einsetzt, wo die Wertschätzung unsicher ist.