Neues lebenslanges Lernmodell verbessert neuronale VRP‑Lösungen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Deep‑Learning‑Ansätze haben sich als vielversprechend für die Lösung von Fahrzeug‑Routing‑Problemen (VRPs) erwiesen, doch bislang wurden die meisten neuronalen Solver in sehr eingeschränkten Szenarien trainiert. Sie nutzen meist nur euklidische Entfernungen zwischen Knoten und beschränken sich auf ein einziges Problem‑Größenformat, was ihre direkte Anwendung in unterschiedlichen realen Situationen stark limitiert.

Um diese Einschränkungen zu überwinden, stellt der neue Ansatz ein lebenslanges Lernframework vor, das einen Transformer als Kern nutzt und VRPs in einer Reihe unterschiedlicher Kontexte schrittweise erlernt. Durch einen inter‑Kontext‑Selbst‑Aufmerksamkeitsmechanismus kann das Modell das aus vorherigen Aufgaben gewonnene Wissen gezielt auf neue Problemstellungen übertragen.

Zusätzlich wird ein dynamischer Kontext‑Scheduler (DCS) eingesetzt, der mittels Cross‑Context‑Experience‑Replay die erlernten Politiken aus vergangenen VRPs erneut nutzt. Dieser Mechanismus unterstützt das lebenslange Lernen, indem er das Modell dazu bringt, aus vergangenen Erfahrungen zu reflektieren und diese für kommende Aufgaben zu optimieren.

Die umfangreichen Tests auf synthetischen und Benchmark‑Datensätzen mit bis zu 18.000 Knoten zeigen, dass das lebenslange Lernmodell effektive Strategien für generische VRPs in variierenden Kontexten entdeckt. Es übertrifft dabei andere neuronale Solver und erzielt die besten Ergebnisse für die meisten Problemvarianten.

Ähnliche Artikel