FSD-CAP: Neue Methode zur fehlenden Knoteneigenschaften in Graphen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Graphenverarbeitung stellt die Imputation fehlender Knoteneigenschaften ein großes Problem dar, besonders wenn mehr als 90 % der Daten fehlen. Traditionelle Ansätze, die auf latenten Darstellungen oder globaler Diffusion beruhen, liefern häufig unzuverlässige Schätzungen und können Fehler im gesamten Netzwerk verbreiten.

Die neue Technik FSD‑CAP (Fractional Subgraph Diffusion with Class‑Aware Propagation) löst dieses Problem in zwei Schritten. Zunächst wird mithilfe eines graphenbasierenden Distanzmaßes ein lokaler Subgraph ausgewählt, in dem die Diffusion stattfindet. Ein fraktionaler Diffusionsoperator passt die Schärfe der Ausbreitung an die lokale Struktur an, sodass nur relevante Nachbarn einbezogen werden.

Im zweiten Schritt werden die vorläufig imputierten Werte durch eine klassenbewusste Propagation verfeinert. Dabei kommen Pseudo‑Labels und die Entropie der Nachbarschaft zum Einsatz, um Konsistenz und Genauigkeit zu erhöhen. Auf fünf Benchmark‑Datensätzen mit 99,5 % fehlenden Features erzielte FSD‑CAP durchschnittliche Klassifikationsgenauigkeiten von 80,06 % (strukturell) und 81,01 % (uniform), knapp hinter den 81,31 % einer voll beobachteten GCN‑Modellierung.

Für die Link‑Prediction erreichte die Methode AUC‑Werte von 91,65 % (strukturell) und 92,41 % (uniform), im Vergleich zu 95,06 % bei vollständigen Daten. Darüber hinaus übertraf FSD‑CAP sowohl bei großen Datensätzen als auch bei heterophilen Strukturen andere aktuelle Modelle, was die Vielseitigkeit und Robustheit der Technik unterstreicht.

Ähnliche Artikel