SAGE: Skalierungsbewusste Evolution für kontinuierliche KG-Embeddings
In der Welt der Wissensgraphen (KG) sind die meisten Embedding‑Methoden auf statische Strukturen ausgelegt. Doch reale Graphen wachsen ständig – neue Entitäten, Relationen und Fakten werden kontinuierlich hinzugefügt. Um dieser Dynamik gerecht zu werden, wurden verschiedene kontinuierliche KG‑Embedding‑Ansätze (CKGE) entwickelt, die bestehende Einbettungen effizient aktualisieren. Ein Problem dieser Verfahren ist jedoch, dass sie die unterschiedlichen Größenordnungen von Updates oft ignorieren und keine systematische Bewertung über den gesamten Aktualisierungsprozess hinweg bieten.
Die neue Methode SAGE (Scale‑Aware Gradual Evolution) adressiert dieses Problem gezielt. Zunächst bestimmt sie die Einbettungsdimensionen anhand der jeweiligen Update‑Skala und erweitert den Embedding‑Raum entsprechend. Anschließend nutzt sie einen Dynamic Distillation-Mechanismus, um ein ausgewogenes Verhältnis zwischen dem Erhalt bereits gelerntes Wissens und der Integration neuer Fakten zu gewährleisten.
In umfangreichen Experimenten auf sieben Benchmark‑Datensätzen konnte SAGE die bestehenden Baselines deutlich übertreffen: die durchschnittliche Mean Reciprocal Rank (MRR) stieg um 1,38 %, die Hit‑Rate bei Top‑1 um 1,25 % und bei Top‑10 um 1,6 %. Darüber hinaus zeigte ein Vergleich mit Modellen, die feste Einbettungsdimensionen verwenden, dass die adaptive Dimensionserweiterung von SAGE in jedem Snapshot die beste Leistung erzielt – ein klarer Beleg für die Bedeutung skalierungsbewusster Embedding‑Strategien in CKGE.
Der Quellcode von SAGE ist öffentlich verfügbar und kann unter https://github.com/lyfxjtu/Dyna eingesehen werden.