LLM-Agent SEISMO steigert Molekuloptimierung um 2‑3‑fach effizienter
In der chemischen Forschung, insbesondere in der Pharmaindustrie, ist die Optimierung von Molekülstrukturen für gewünschte Eigenschaften ein entscheidender Engpass. SEISMO, ein neuer Large‑Language‑Model‑Agent, löst dieses Problem, indem er ausschließlich online und im Inferenzzeitraum arbeitet. Nach jedem Aufruf eines teuren Orakels – etwa eines experimentellen Tests – aktualisiert SEISMO seine Vorschläge, ohne auf populationsbasierte oder batch‑basierte Lernverfahren zurückzugreifen.
Der Agent nutzt die gesamte Optimierungshistorie, kombiniert natürliche Sprachbeschreibungen der Aufgabe mit numerischen Bewertungen und, wenn vorhanden, strukturiertem erklärendem Feedback. Auf dem Practical Molecular Optimization Benchmark mit 23 Aufgaben erzielt SEISMO ein 2‑ bis 3‑fach höheres Ergebnis im Bereich unter der Optimierungskurve als frühere Methoden. Oft erreicht er nahezu maximale Punktzahlen innerhalb von nur 50 Orakelauswertungen.
Zusätzliche Tests in der medizinischen Chemie zeigen, dass erklärendes Feedback die Effizienz weiter steigert. Diese Ergebnisse unterstreichen, dass die Einbindung von Fachwissen und strukturierten Informationen entscheidend für eine ressourcenschonende Molekuloptimierung ist.