ChemFixer: Korrigiert ungültige Moleküle und eröffnet neues chemisches Potential
Deep‑Learning‑Modelle zur molekularen Generierung haben das Potenzial, riesige chemische Räume zu erkunden und neue Wirkstoffkandidaten zu entdecken. Ein häufiges Hindernis ist jedoch, dass die erzeugten Strukturen oft chemisch ungültig sind, was die praktische Anwendbarkeit stark einschränkt. ChemFixer löst dieses Problem, indem es ungültige Moleküle in gültige überführt.
Der Ansatz basiert auf einer Transformer‑Architektur, die zunächst mit Masking‑Techniken vortrainiert und anschließend auf einem umfangreichen Datensatz aus gültigen und ungültigen Molekül‑Paaren feinjustiert wird. In umfangreichen Tests mit verschiedenen Generierungsmodellen konnte ChemFixer die Gültigkeit der Moleküle signifikant erhöhen, ohne die chemischen oder biologischen Eigenschaften der Ausgangsstrukturen zu verfälschen. Dadurch wird ein bislang unerreichbarer Teil des chemischen Raums zugänglich.
Ein besonders vielversprechender Anwendungsfall ist die Vorhersage von Arzneimittel‑Zielinteraktionen (DTI) unter Datenknappheit. Durch die Anwendung von ChemFixer wurden die Gültigkeit der generierten Liganden verbessert und neue, vielversprechende Liganden‑Protein‑Paare entdeckt. Diese Ergebnisse zeigen, dass ChemFixer nicht nur in ressourcenarmen Szenarien wirkt, sondern auch für eine breite Palette von nachgelagerten Aufgaben einsetzbar ist.
Insgesamt bietet ChemFixer ein praktisches Werkzeug für alle Phasen der KI‑gestützten Wirkstoffentwicklung. Es erweitert die Vielfalt potenzieller Kandidaten, steigert die Zuverlässigkeit der generierten Moleküle und unterstützt die Forschung bei der effizienten Erschließung neuer chemischer Strukturen.