S3-GFN: Neue Methode erzeugt praktisch synthetisierbare Moleküle mit GFlowNets
Ein neues arXiv-Preprint (2602.04119v1) präsentiert S3‑GFN, ein generatives Modell, das Moleküle erzeugt, die in der Praxis leicht synthetisiert werden können. Die Arbeit richtet sich an die Forschung im Bereich der KI‑gestützten Wirkstoffentwicklung, wo die Fähigkeit, de‑novo‑Moleküle zu generieren, die tatsächlich hergestellt werden können, bislang stark eingeschränkt war.
Frühere Ansätze nutzten Generative Flow Networks (GFlowNets), um Synthesierbarkeit durch harte Einschränkungen zu erzwingen. Dabei wurden Zustands- und Aktionsräume strikt auf vordefinierte Reaktionsvorlagen und Bausteine beschränkt. Diese Methode zeigte vielversprechende Ergebnisse, blieb jedoch in Flexibilität und Skalierbarkeit hinter den Erwartungen zurück.
S3‑GFN löst dieses Problem, indem es eine sequenzbasierte GFlowNet‑Architektur mit einer weichen Regularisierung kombiniert. Das Modell nutzt umfangreiche molekulare Priors, die aus großen SMILES‑Korpora gelernt wurden, um die Molekülgenerierung gezielt in hochbelohnte, synthetisierbare Chemie‑räume zu lenken.
Die Lernstrategie basiert auf off‑policy Replay‑Training und einem kontrastiven Lernsignal, das separate Pufferspeicher für synthetisierbare und unsynthesierbare Proben verwendet. Durch diese Technik werden implizite Synthesierbarkeitsbeschränkungen in das Training eingebettet, ohne die Modellflexibilität einzuschränken.
Experimentelle Ergebnisse zeigen, dass S3‑GFN in einer Vielzahl von Aufgaben mehr als 95 % der generierten Moleküle als synthetisierbar klassifiziert und gleichzeitig höhere Belohnungen erzielt. Diese Fortschritte markieren einen bedeutenden Schritt in Richtung praktikabler KI‑gestützter Wirkstoffdesigns.