Universelle Prozessdarstellung beschleunigt Materialentdeckung
Die langsame und kostenintensive experimentelle Validierung chemischer Prozesse hemmt die Entdeckung neuer Materialien. Künstliche Intelligenz kann vielversprechende Kandidaten priorisieren, doch die vorhandenen Daten aus Patenten und Fachliteratur sind heterogen und schwer nutzbar. Forscher haben deshalb eine universelle, gerichtete Baumstruktur – den Prozess-Graph – entwickelt, die unstrukturierte Texte, Molekülstrukturen und numerische Messwerte in ein einziges maschinenlesbares Format überführt.
Zur Auswertung dieser strukturierten Daten wurde ein multimodales Graph-Neuronales Netzwerk mit einer eigenschaftsbedingten Aufmerksamkeitsmechanik konzipiert. Das Modell wurde mit rund 700.000 Prozess-Graphen aus fast 9.000 unterschiedlichen Dokumenten trainiert und erlernt semantisch reiche Einbettungen, die über verschiedene Fachbereiche hinweg generalisieren.
Bei einer Feinabstimmung auf kompakte, domänenspezifische Datensätze erzielt das vortrainierte Modell beeindruckende Ergebnisse. Damit wird deutlich, dass universell erlernte Prozessrepräsentationen bei minimalem zusätzlichem Datenaufwand effektiv auf spezialisierte Vorhersageaufgaben übertragen werden können.