SymLight: Interpretable und deploybare Symbolische Verkehrslichtsteuerung
Deep Reinforcement Learning hat bereits große Erfolge bei der automatischen Entwicklung von Verkehrslichtsteuerungsstrategien erzielt. Neuronale Modelle sind jedoch oft überparameterisiert und wenig transparent, was ihre Interpretierbarkeit und die Ausführung auf ressourcenbeschränkten Edge‑Geräten erschwert.
Mit dem neuen Ansatz SymLight wird dieses Problem angegangen. Das System nutzt Monte‑Carlo‑Tree‑Search (MCTS), um symbolische Prioritätsfunktionen zu entdecken, die als Verkehrslichtsteuerungspolicies dienen. Die Prioritätsfunktion nimmt Verkehrsdaten als Eingabe und weist jeder Phase ein Prioritätslevel zu, das anschließend die Phasenwechsel steuert.
Um die Suche effizient zu gestalten, wurde eine kompakte, aber ausdrucksstarke Repräsentation der Prioritätsfunktionen entwickelt, die die kombinatorische Explosion des Aktionsraums im MCTS reduziert. Zusätzlich kommt eine probabilistische strukturelle Rollout‑Strategie zum Einsatz, die aus bereits gefundenen hochwertigen Funktionen Muster extrahiert und den Rollout-Prozess gezielt leitet.
In Experimenten mit realen Datensätzen zeigte SymLight eine überlegene Leistung gegenüber einer Reihe von Baselines. Der entscheidende Vorteil liegt darin, dass SymLight interpretierbare und leicht deploybare Verkehrslichtsteuerungspolicies liefert, ohne dabei die Performance zu beeinträchtigen.