ChefNMR: KI-Modell entschlüsselt Molekülstrukturen aus NMR-Spektren
Nuklearmagnetische Resonanz (NMR)-Spektroskopie bleibt das wichtigste Verfahren zur Bestimmung der Strukturen kleiner Moleküle, doch die Interpretation der Spektren ist bislang ein mühsamer, manueller Prozess, der umfangreiches Fachwissen erfordert.
Mit dem neuen Framework ChefNMR (CHemical Elucidation From NMR) wird dieser Aufwand drastisch reduziert. Das System kann die Struktur eines unbekannten Moleküls allein aus seinem 1‑D‑NMR‑Spektrum und seiner chemischen Formel vorhersagen – ein vollständiger, end‑to‑end‑Ansatz.
ChefNMR nutzt ein atomare Diffusionsmodell, das auf einer nicht‑equivarianten Transformer‑Architektur basiert. Zur Erfassung der komplexen chemischen Gruppen natürlicher Produkte wurde ein Datensatz mit simulierten 1‑D‑NMR‑Spektren für über 111 000 natürliche Produkte erstellt.
Das Modell erreicht bei der Vorhersage von herausfordernden natürlichen Produktverbindungen eine beispiellose Genauigkeit von mehr als 65 %. Damit stellt es einen bedeutenden Fortschritt bei der Automatisierung der Strukturaufklärung kleiner Moleküle dar und demonstriert das enorme Potenzial von Deep‑Learning, die Entdeckung neuer Wirkstoffe zu beschleunigen. Der Code ist frei verfügbar unter https://github.com/ml-struct-bio/chefnmr.