DANS-KGC: Diffusionsbasiertes negatives Sampling für Knowledge-Graph-Completion

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In der Welt der Knowledge-Graph-Representation spielt das Negative Sampling (NS) eine entscheidende Rolle. Traditionelle NS-Methoden leiden jedoch unter Schwächen wie der Anfälligkeit für falsche Negativbeispiele, eingeschränkter Generalisierbarkeit und fehlender Kontrolle über die Schwierigkeit der generierten Samples. Um diese Probleme zu lösen, präsentiert die neue Arbeit DANS-KGC – Diffusionsbasiertes Adaptive Negative Sampling für Knowledge-Graph-Completion.

DANS-KGC besteht aus drei Kernkomponenten. Das Difficulty Assessment Module (DAM) bewertet die Lernschwierigkeit von Entitäten, indem es semantische und strukturelle Merkmale kombiniert. Auf Basis dieser Bewertung nutzt das Adaptive Negative Sampling Module (ANS) ein konditioniertes Diffusionsmodell mit schwierigkeitssensiblen Rauschplänen. Dabei werden semantische und Nachbarschaftsinformationen während der Denoising-Phase einbezogen, um negative Samples mit unterschiedlicher Härte zu erzeugen.

Das Dynamic Training Mechanism (DTM) schließt das System ab, indem es die Härteverteilung der Negativsamples während des Trainings dynamisch anpasst. Dadurch entsteht ein curriculum‑basiertes Lernverlauf, der von einfachen zu anspruchsvolleren Beispielen übergeht. Umfangreiche Experimente auf sechs Benchmark‑Datensätzen zeigen, dass DANS-KGC die State‑of‑the‑Art‑Ergebnisse für alle drei Evaluationsmetriken bei den UMLS‑ und YAGO3‑10‑Datensätzen erzielt.

Ähnliche Artikel