M^4olGen: Mehrstufige Molekülgenerierung mit präziser Multi-Property-Steuerung
Die neueste Veröffentlichung von M^4olGen präsentiert einen zweistufigen Ansatz zur Erzeugung von Molekülen, die exakt mehrere physikochemische Eigenschaften erfüllen. Im ersten Schritt generiert ein Multi-Agenten-Reasoner fragmentbasierte Prototypen, die nahe an der zulässigen Lösungsregion liegen. Anschließend optimiert ein RL‑basiertes Optimierungsmodul, das mit Group Relative Policy Optimization (GRPO) trainiert wurde, die Moleküle in einer fein abgestimmten, mehrstufigen Schleife, um die Abweichungen der Zielwerte zu minimieren und gleichzeitig die Komplexität der Änderungen zu kontrollieren.
Ein umfangreiches, automatisch kuratiertes Datenset mit detaillierten Fragment‑Editierungsketten und gemessenen Eigenschaftsänderungen bildet die Grundlage für beide Phasen. Dadurch erhält das System deterministische, reproduzierbare Anweisungen und ermöglicht kontrollierte Mehrschritt‑Logik. Im Vergleich zu bisherigen Ansätzen nutzt M^4olGen gezielt Fragmentinformationen und bietet damit eine deutlich verbesserte Fähigkeit, Moleküle gezielt an numerische Zielwerte anzupassen.
Experimentelle Ergebnisse zeigen, dass M^4olGen bei der Erfüllung von zwei unterschiedlichen Eigenschaftsgruppen – QED, LogP, Molekulargewicht sowie HOMO und LUMO – konsistente Verbesserungen in der Gültigkeit und der genauen Zielerreichung erzielt. Dabei übertrifft das System sowohl starke große Sprachmodelle als auch graphbasierte Algorithmen, was die Effektivität der kombinierten Retrieval‑ und Reinforcement‑Learning‑Strategie unterstreicht.