LeanRAG: Wissensgraph-basiertes Framework für effiziente Retrieval-Augmented Generation

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die neue Methode LeanRAG kombiniert Wissensgraphen mit Retrieval-Augmented Generation (RAG), um die Qualität von Large Language Models zu verbessern. RAG nutzt externe Daten, doch die Effektivität leidet häufig an ungenauen oder unvollständigen Suchergebnissen. LeanRAG adressiert dieses Problem, indem es Wissensgraphen in hierarchische Strukturen organisiert und gleichzeitig die fehlenden Verbindungen zwischen den hochrangigen Zusammenfassungen schafft.

Im Kern verwendet LeanRAG einen innovativen semantischen Aggregationsalgorithmus, der Entitäten in Cluster zusammenfasst und explizite Beziehungen zwischen den Aggregations‑Level‑Zusammenfassungen erstellt. Dadurch entsteht ein vollständig navigierbares semantisches Netzwerk, das die zuvor isolierten „semantischen Inseln“ verbindet.

Der Retrieval‑Ansatz von LeanRAG ist strukturgesteuert und arbeitet von unten nach oben. Zunächst werden Anfragen an die relevantesten feinkörnigen Entitäten gebunden. Anschließend folgt eine systematische Traversierung der semantischen Pfade des Graphen, um kompakte, aber kontextreichere Evidenzsets zu sammeln. Dieser Ansatz reduziert den Aufwand für Pfadsuchen erheblich und verhindert redundante Informationsabrufe.

Umfangreiche Experimente zeigen, dass LeanRAG die Effizienz von RAG deutlich steigert und die Qualität der generierten Antworten verbessert. Das Framework bietet damit einen vielversprechenden Weg, um die Grenzen herkömmlicher Retrieval‑Methoden zu überwinden und die Leistungsfähigkeit von Sprachmodellen nachhaltig zu erhöhen.

Ähnliche Artikel