KI lernt chemische Mechanismen: Neue Methode erklärt Reaktionsschritte
Ein neues Forschungsprojekt zeigt, wie Sprachmodelle chemische Reaktionsmechanismen anhand des klassischen Pfeil‑Schiebe‑Formalismus vorhersagen können. Durch die Einführung des kompakt codierten Formats MechSMILES, das Molekülstrukturen und Elektronenfluss in einer einzigen Textzeile darstellt, wurden Modelle auf vier zunehmend komplexen Aufgaben trainiert.
Die Ergebnisse sind beeindruckend: Für die Vorhersage einzelner Reaktionsschritte erreichen die Modelle mehr als 95 % Top‑3‑Genauigkeit. Auf dem umfangreichen Dataset mech‑USPTO‑31k liegt die Trefferquote bei über 73 % und bei FlowER, einem Datensatz für komplette Mechanismen, bei 93 %. Damit übertrifft die Methode die bisherigen Standards in der Mechanismusvorhersage.
Die praktische Bedeutung ist vielfältig. Erstens können die Modelle als Nachprüfer für Computer‑gestützte Syntheseplanung (CASP) eingesetzt werden, um chemisch unmögliche Transformationen auszuschließen. Zweitens ermöglichen sie eine atom‑zu‑atom‑Abbildung, die sämtliche Atome – einschließlich Wasserstoff – berücksichtigt. Drittens extrahieren sie katalysator‑bewusste Reaktionsvorlagen, die zwischen wiederverwendbaren Katalysatoren und bloßen Beobachter‑Spektren unterscheiden.
Durch die Einhaltung physikalischer Gesetze, wie Massenerhaltung und Ladungskonservierung, liefert die Methode nicht nur genaue Vorhersagen, sondern auch nachvollziehbare Erklärungen. Damit ebnet sie den Weg zu erklärbarer und chemisch gültiger computergestützter Syntheseplanung und bietet gleichzeitig ein architekturunabhängiges Benchmark‑Framework für zukünftige Entwicklungen.