Neue BO-Methode nutzt KI-Modelle für effiziente Molekülentdeckung
Eine neue Technik zur Bayesschen Optimierung (BO) kombiniert die Kraft großer Sprachmodelle und chemie-spezifischer Foundation‑Modelle, um die Suche nach vielversprechenden Molekülen deutlich zu beschleunigen. Statt ein komplexes probabilistisches Surrogat zu bauen, nutzt die Methode die bereits vorhandenen Wissensrepräsentationen dieser Modelle, um die Akquisitionsfunktionen direkt zu steuern.
Durch die Eliminierung eines expliziten Surrogatmodells wird die Berechnung erheblich vereinfacht, während gleichzeitig die Vorhersagekraft der KI-Modelle genutzt wird. Zusätzlich wird der Molekülraum in eine baumartige Struktur unterteilt, in der lokale Akquisitionsfunktionen optimiert werden. Diese Aufteilung ermöglicht die Anwendung von Monte‑Carlo‑Tree‑Search, um Kandidaten effizient auszuwählen.
Ein weiterer Fortschritt ist die Einbindung von grobkörniger Clustering‑Technik, die auf Sprachmodellen basiert. Dadurch werden die Akquisitionsfunktionen nur in Clustern mit statistisch höheren Eigenschaften ausgeführt, was die Skalierbarkeit auf sehr große Kandidatensätze verbessert. Experimente zeigen, dass die Methode die Skalierbarkeit, Robustheit und Stichprobeneffizienz in der KI‑gestützten BO für die Molekülentdeckung deutlich steigert.