Neues Benchmark für Anomalie‑Erkennung in Text‑attributed Graphen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Benchmark‑Set namens TAG‑AD wurde vorgestellt, das die Erkennung von anomalen Knoten in Text‑attributed Graphen (TAGs) systematisch bewertet. TAG‑AD füllt die bisherige Lücke, weil es bislang keine standardisierten Datensätze für diese Art von Graphen gibt.

Das Set nutzt große Sprachmodelle (LLMs), um realistische anomale Knotentexte direkt im Rohtextraum zu erzeugen. Diese Anomalien sind semantisch zusammenhängend, weisen aber kontextuelle Inkonsistenzen auf, was sie besonders nah an echten Abweichungen in realen Anwendungen macht. Zusätzlich enthält TAG‑AD verschiedene Anomalie‑Typen, sodass Methoden umfassend und reproduzierbar getestet werden können.

Mit TAG‑AD wurden bestehende unüberwachte GNN‑basierte Anomalie‑Erkennungs‑Methoden sowie Zero‑Shot‑LLMs evaluiert. Die Ergebnisse zeigen, dass LLMs besonders gut kontextuelle Anomalien erkennen, während GNN‑Methoden bei strukturellen Anomalien überlegen bleiben. Diese klare Trennung der Stärken liefert wertvolle Einblicke für die Weiterentwicklung von Graph‑Anomalie‑Detection‑Algorithmen.

Ein weiteres Highlight ist das vorgeschlagene RAG‑unterstützte Zero‑Shot‑Framework, das eine globale Anomalie‑Wissensdatenbank nutzt und in wiederverwendbare Analyse‑Frameworks überführt. Durch diese Retrieval‑Augmented‑Generation‑Ansatz wird die Abhängigkeit von fragilen, handgefertigten Prompt‑Strukturen reduziert und die Leistungsfähigkeit von LLMs für die Anomalie‑Erkennung weiter gesteigert.

Ähnliche Artikel