SPECTRA: Spektrale Graph-Augmentation für unausgewogene Molekülprognosen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Vorhersage molekularer Eigenschaften liegen die wertvollsten Verbindungen – etwa solche mit hoher Wirksamkeit – häufig in seltenen Bereichen des Zielraums. Klassische Graph Neural Networks (GNNs) optimieren meist den durchschnittlichen Fehler und liefern deshalb bei diesen kritischen, aber seltenen Fällen unzureichende Ergebnisse. Traditionelle Oversampling‑Methoden können zudem die molekulare Topologie verfälschen.

Die neue Methode SPECTRA löst dieses Problem, indem sie realistische Molekülgraphen im Spektralbereich erzeugt. Zunächst rekonstruiert sie mehrattribute Molekülgraphen aus SMILES, ordnet anschließend Molekülpaare mittels (Fused) Gromov‑Wasserstein‑Couplings zu, um Knotenkorrespondenzen zu bestimmen, und interpoliert dann Laplace‑Eigenwerte, Eigenvektoren sowie Knoteneigenschaften in einer stabilen gemeinsamen Basis.

Durch die Rekonstruktion von Kanten entstehen physikalisch plausible Zwischenmoleküle mit interpolierten Zielwerten. Ein seltenerheitsbewusstes Budgetierungsschema, das auf einer Kernel‑Dichte‑Schätzung der Labels basiert, konzentriert die Augmentation gezielt dort, wo Daten knapp sind. In Kombination mit einem spektralen GNN, das kantenbewusste Chebyshev‑Konvolutionen nutzt, füllt SPECTRA unterrepräsentierte Regionen auf, ohne die globale Genauigkeit zu verschlechtern.

Auf mehreren Benchmarks zeigt SPECTRA konsequent eine Reduktion des Fehlers in relevanten Zielbereichen, während die Gesamt‑MAE konkurrenzfähig bleibt. Zusätzlich liefert die Methode interpretierbare synthetische Moleküle, deren Struktur die zugrunde liegende spektrale Geometrie widerspiegelt.

Die Ergebnisse demonstrieren, dass spektrale, geometrieorientierte Augmentation eine effektive und effiziente Strategie für die Regression unausgewogener molekularer Eigenschaften darstellt.

Ähnliche Artikel