CRoC: Neue Methode zur Graphanomalie-Erkennung mit wenig gelabelten Daten
Graph Neural Networks (GNNs) sind das Herzstück moderner graphbasierter Anwendungen, doch ihre Leistungsfähigkeit hängt stark von umfangreichen gelabelten Datensätzen ab. In der Graphanomalie-Erkennung (GAD) stellen seltene, kostenintensive Labels ein großes Hindernis dar, weil Anomalien oft gezielt ihre Muster verschleiern. Die neue Methode CRoC (Context Refactoring Contrast) löst dieses Problem, indem sie gleichzeitig auf begrenzte gelabelte und reichlich unlabelte Daten zurückgreift.
CRoC nutzt die inhärente Klassenungleichgewicht in GAD, um den Kontext jedes Knotens neu zu gestalten. Dabei werden erweiterte Graphen erzeugt, indem die Attribute der Knoten neu zusammengesetzt werden, während die Interaktionsmuster erhalten bleiben. Zusätzlich werden heterogene Beziehungen separat kodiert und in den Message‑Passing‑Prozess integriert, was die Fähigkeit des Modells erhöht, komplexe Interaktionssemantiken zu erfassen. Diese Vorgehensweise bewahrt die Semantik der Knoten und stärkt die Robustheit gegen gezielte Täuschungsversuche.
Im Trainingsstadium wird CRoC mit kontrastivem Lernen kombiniert, sodass GNNs das unlabelte Datenmaterial effektiv nutzen können. Das Ergebnis sind reichhaltigere, besser differenzierende Knoteneinbettungen. Auf sieben realen GAD‑Datensätzen unterschiedlicher Größenordnung zeigte CRoC überzeugende Leistungen und demonstriert damit das Potenzial, die Grenzen der graphbasierten Anomalieerkennung mit begrenzter Supervision zu überwinden.