Multi‑RF Fusion mit Multi‑GNN Blending führt zu Top‑Resultat bei Molekülvorhersagen
Eine neue Methode zur Vorhersage molekularer Eigenschaften, veröffentlicht auf arXiv (2603.20724v1), hat die aktuelle Rangliste des Open Graph Benchmark (OGB) für das Dataset ogbg‑molhiv neu definiert. Das Modell erziel…
- Eine neue Methode zur Vorhersage molekularer Eigenschaften, veröffentlicht auf arXiv (2603.20724v1), hat die aktuelle Rangliste des Open Graph Benchmark (OGB) für das Da…
- Das Modell erzielt einen Test‑ROC‑AUC von 0,8476 ± 0,0002 – damit den ersten Platz einsteigend und HyperFusion mit 0,8475 ± 0,0003 knapp überholt.
- Der Kern der Technik ist ein rank‑averaged Ensemble aus zwölf Random‑Forest‑Modellen, die auf einer Kombination von vier Fingerprint‑Typen (FCFP, ECFP, MACCS, Atom‑Pairs…
Eine neue Methode zur Vorhersage molekularer Eigenschaften, veröffentlicht auf arXiv (2603.20724v1), hat die aktuelle Rangliste des Open Graph Benchmark (OGB) für das Dataset ogbg‑molhiv neu definiert. Das Modell erzielt einen Test‑ROC‑AUC von 0,8476 ± 0,0002 – damit den ersten Platz einsteigend und HyperFusion mit 0,8475 ± 0,0003 knapp überholt.
Der Kern der Technik ist ein rank‑averaged Ensemble aus zwölf Random‑Forest‑Modellen, die auf einer Kombination von vier Fingerprint‑Typen (FCFP, ECFP, MACCS, Atom‑Pairs) mit insgesamt 4.263 Merkmalen trainiert wurden. Diese Random‑Forest‑Vorhersagen werden anschließend mit einer tiefen Ensemble‑GNN‑Vorhersage zu 12 % Gewicht gemischt.
Zwei zentrale Erkenntnisse erklären den Erfolg: Erstens führt die Einstellung von max_features auf 0,20 – statt des Standardwerts sqrt(d) – zu einer AUC‑Steigerung von 0,008 bei der Scaffold‑Split‑Aufgabe. Zweitens eliminiert die Mittelung der GNN‑Vorhersagen über zehn verschiedene Seeds die Varianz der GNN‑Modelle vollständig, wodurch die endgültige Standardabweichung von 0,0008 auf 0,0002 sinkt.
Wichtig ist, dass die Methode ohne externe Daten oder vortrainierte Modelle auskommt, was sie besonders praktisch für Anwendungen mit begrenzten Ressourcen macht. Die Ergebnisse setzen damit neue Maßstäbe für die Genauigkeit von Molekül‑Property‑Prediction‑Modellen.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.