SymLight: Interpretable und deploybare Symbolische Verkehrslichtsteuerung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Deep Reinforcement Learning hat bereits große Erfolge bei der automatischen Entwicklung von Verkehrslichtsteuerungs­strategien erzielt. Neuronale Modelle sind jedoch oft überparameterisiert und wenig transparent, was ihre Interpretierbarkeit und die Ausführung auf ressourcenbeschränkten Edge‑Geräten erschwert.

Mit dem neuen Ansatz SymLight wird dieses Problem angegangen. Das System nutzt Monte‑Carlo‑Tree‑Search (MCTS), um symbolische Prioritätsfunktionen zu entdecken, die als Verkehrslichtsteuerungs­policies dienen. Die Prioritätsfunktion nimmt Verkehrs­daten als Eingabe und weist jeder Phase ein Prioritäts­level zu, das anschließend die Phasen­wechsel steuert.

Um die Suche effizient zu gestalten, wurde eine kompakte, aber ausdrucksstarke Repräsentation der Prioritätsfunktionen entwickelt, die die kombinatorische Explosion des Aktionsraums im MCTS reduziert. Zusätzlich kommt eine probabilistische strukturelle Rollout‑Strategie zum Einsatz, die aus bereits gefundenen hochwertigen Funktionen Muster extrahiert und den Rollout-Prozess gezielt leitet.

In Experimenten mit realen Datensätzen zeigte SymLight eine überlegene Leistung gegenüber einer Reihe von Baselines. Der entscheidende Vorteil liegt darin, dass SymLight interpretierbare und leicht deploybare Verkehrslichtsteuerungs­policies liefert, ohne dabei die Performance zu beeinträchtigen.

Ähnliche Artikel