Hierarchisches Signalsteuerungssystem kombiniert Modelloptimierung & RL
Ein neues hierarchisches Steuerungskonzept für Verkehrsampeln in städtischen Korridoren vereint klassische Modelloptimierung mit modernem Reinforcement Learning. Das System besteht aus drei Ebenen: Ein High‑Level Coordinator (HLC) wählt dynamisch zwischen Max‑Flow‑ und Green‑Wave‑Koordination, ein Corridor Coordinator setzt die jeweiligen Phasenbeschränkungen um, und Hybrid Signal Agents (HSAs) bestimmen die Ampelphasen mithilfe von PPO‑basiertem Reinforcement Learning mit Aktionsmaskierung.