Effizientes DRL-Umfeld für flexible Job-Shop-Planung
In einer neuen Veröffentlichung wird ein einfaches, chronologisches Deep‑Reinforcement‑Learning‑Umfeld für das Flexible Job‑Shop‑Scheduling Problem (FJSP) vorgestellt. Das Umfeld basiert auf einer diskreten Ereignissimulation und ermöglicht es, schnell und präzise Planungslösungen zu generieren. Aufbauend auf diesem Umfeld wird ein end‑to‑end‑DRL‑Modell mit Proximal Policy Optimization (PPO) entwickelt.