Deep Reinforcement Learning optimiert Gummi-Reifenfilmproduktion
Die Einführung von Smart‑Manufacturing löst die Engpässe traditioneller, zentralisierter Planungsansätze in der Gummi‑Reifenindustrie. Insbesondere die Notwendigkeit, dynamische Produktionsanforderungen flexibel zu bewältigen, wird dadurch adressiert.
Moderne Reifenfertigungssysteme bestehen aus komplexen Netzwerken eng miteinander verknüpfter Teilsysteme, die starke nichtlineare Wechselwirkungen und emergente Dynamiken aufweisen. Diese Komplexität erschwert die effektive Koordination mehrerer Subsysteme und stellt eine zentrale Herausforderung dar.
Zur Bewältigung hochdimensionaler, mehrzieliger Optimierungsprobleme wurde ein neues Deep‑Reinforcement‑Learning‑Verfahren entwickelt: Multi‑Path Differentiated Clipping Proximal Policy Optimization (MPD‑PPO). Das Verfahren nutzt eine mehrzweige Politikarchitektur mit differenzierten Gradient‑Clipping‑Beschränkungen, um stabile und effiziente Updates in hochdimensionalen Policy‑Räumen zu gewährleisten.
Experimentelle Tests in der Breiten- und Dickekontrolle von Gummi‑Reifenfilmen zeigen, dass MPD‑PPO die Abstimmungsgenauigkeit und die betriebliche Effizienz deutlich verbessert. Das Framework löst erfolgreich die Herausforderungen hoher Dimensionalität, mehrzieliger Trade‑Offs und dynamischer Anpassung und liefert damit verbesserte Leistung und Produktionsstabilität für die Echtzeit‑Anwendung in der Reifenfertigung.