SEAL‑RAG: Ersetzen statt Erweitern steigert Multi‑Hop RAG Genauigkeit

arXiv – cs.AI Original ≈2 Min. Lesezeit
Anzeige

Retrieval‑Augmented Generation‑Systeme (RAG) stoßen bei mehrstufigen Fragen häufig an ihre Grenzen, wenn die erste Suche das notwendige Bindungselement nicht findet. Traditionelle Korrekturansätze wie Self‑RAG, CRAG oder Adaptive‑k versuchen das Problem meist durch Hinzufügen von mehr Kontext oder das Kürzen bestehender Listen zu lösen. Doch das bloße Ausweiten des Kontextfensters führt häufig zu „Kontext‑Dilution“, bei der Ablenkungen relevante Informationen verdrängen.

SEAL‑RAG ist ein trainingsfreier Steuermechanismus, der das Prinzip „Ersetzen statt Erweitern“ verfolgt und dabei die maximale Abruftiefe k festlegt. Der SEAL‑Zyklus besteht aus vier Schritten: Search → Extract → Assess → Loop. Dabei werden in Echtzeit, entitätsorientierte Extraktionen durchgeführt, um fehlende Entitäten oder Relationen zu identifizieren. Anschließend werden gezielte Mikro‑Abfragen ausgelöst und mithilfe einer entitäts‑first‑Ranking‑Strategie werden Ablenkungen aktiv durch evidenzrelevante Informationen ersetzt.

In einer vergleichenden Evaluation gegen Basic‑RAG, CRAG, Self‑RAG und Adaptive‑k wurden die Modelle auf HotpotQA und 2WikiMultiHopQA getestet. Bei HotpotQA (k = 3) erzielte SEAL‑RAG eine Steigerung der Antwortkorrektheit um 3–13 pp und die Evidenzpräzision um 12–18 pp gegenüber Self‑RAG. Auf 2WikiMultiHopQA (k = 5) übertraf SEAL‑RAG Adaptive‑k um 8,0 pp in der Genauigkeit und hielt gleichzeitig eine Evidenzpräzision von 96 % – im Vergleich zu lediglich 22 % bei CRAG. Alle Verbesserungen sind statistisch signifikant (p < 0.001).

Durch die konsequente Ersetzung von irrelevanten Informationen bei fester Abruftiefe reduziert SEAL‑RAG die Kontext‑Dilution erheblich und liefert gleichzeitig höhere Genauigkeit und Evidenzqualität. Diese Ergebnisse zeigen, dass ein „Ersetzen statt Erweitern“-Ansatz ein vielversprechender Weg ist, um die Leistungsfähigkeit von Multi‑Hop RAG‑Systemen nachhaltig zu steigern.

Ähnliche Artikel