Spreading Activation verbessert Dokumentensuche in RAG-Systemen mit Knowledge Graphs
Retrieval‑Augmented Generation (RAG) Systeme haben zwar Fortschritte erzielt, stoßen aber weiterhin an Grenzen, wenn es darum geht, die mehrstufigen Beweise zu finden, die für komplexe Rechenaufgaben nötig sind. Traditionelle RAG‑Frameworks behandeln alle abgerufenen Informationen gleichwertig und ignorieren dabei die unterschiedliche Glaubwürdigkeit und die Verknüpfungen in großen Textkorpora.
GraphRAG‑Ansätze versuchen, diese Lücke zu schließen, indem sie Knowledge Graphs nutzen, die Informationen in Knoten und Kanten strukturieren und so mehrstufige logische Pfade ermöglichen. Der Nachteil ist jedoch, dass sie auf hochwertige Graphrepräsentationen angewiesen sind – entweder auf teure, manuell erstellte Graphen oder auf automatisierte Pipelines, die häufig unzuverlässig sind. Zudem greifen die meisten Systeme auf große Sprachmodelle zurück, um die Graphdurchquerung zu steuern, was die gleichen Probleme wie bei Standard‑RAG aufwirft.
In der vorliegenden Arbeit wird ein neues RAG‑Framework vorgestellt, das den Spreading‑Activation‑Algorithmus einsetzt, um Informationen aus einem Dokumentenkorpus abzurufen, der durch automatisch konstruierte Knowledge Graphs verbunden ist. Diese Methode erhöht die Leistungsfähigkeit großer Sprachmodelle bei anspruchsvollen Aufgaben wie Multi‑Hop‑Fragenbeantwortung.
Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Verfahren die Leistung iterativer RAG‑Methoden erreicht oder sogar übertrifft, während es gleichzeitig leicht in bestehende Systeme integrierbar ist.