Neuer Transformer-Ansatz ersetzt funktionelle Gruppen in Chemikalien automatisch

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Chemoinformatik ist das gezielte Ersetzen von funktionellen Gruppen ein zentrales Verfahren, um neue Moleküle mit gewünschten Eigenschaften zu entwerfen. Traditionelle, regelbasierte Methoden stoßen dabei häufig an ihre Grenzen, wenn es um die Erzeugung vielfältiger und origineller Strukturen geht. Ein neuer Ansatz nutzt Transformer‑Modelle, um diese Herausforderung zu meistern.

Der vorgestellte Ansatz arbeitet in zwei Schritten: Zuerst wird die zu entfernende funktionelle Gruppe identifiziert, anschließend wird die passende Ersatzgruppe generiert. Durch diese sequentielle Vorgehensweise bleibt die strukturelle Integrität des Moleküls erhalten, während gleichzeitig neue chemische Varianten entstehen.

Für das Training wurde ein umfangreiches Datenset aus gematchten Molekülpaaren (MMPs) aus der ChEMBL-Datenbank verwendet. Das Encoder‑Decoder‑Transformer-Modell arbeitet mit SMIRKS‑basierten Darstellungen, die die Transformationregeln präzise erfassen. Umfangreiche Tests zeigen, dass das Modell chemisch gültige Transformationen erzeugt, einen breiten chemischen Raum erkundet und bei unterschiedlichen Suchgrößen skalierbar bleibt.

Ähnliche Artikel