LiveVectorLake: Echtzeit‑Vektor‑Datenbank mit Versionskontrolle für RAG‑Systeme

arXiv – cs.AI Original ≈2 Min. Lesezeit
Anzeige

Die neueste Veröffentlichung von LiveVectorLake löst ein langjähriges Dilemma in Retrieval‑Augmented Generation (RAG) Systemen: Vektor‑Indizes liefern schnelle Suchergebnisse, verarbeiten aber kontinuierliche Wissensupdates kaum, während Daten‑Lakes Versionierung ermöglichen, aber die Abfragegeschwindigkeit verlangsamen. LiveVectorLake kombiniert das Beste aus beiden Welten.

Die Architektur nutzt drei zentrale Innovationen: Erstens erfolgt die Synchronisation von Datenchunks auf Chunk‑Ebene über SHA‑256‑Hashes, wodurch Änderungen deterministisch erkannt werden, ohne externen Status zu verfolgen. Zweitens trennt LiveVectorLake die heißen Daten in einem Milvus‑HNSW‑Index für sofortige semantische Suche von den kalten, spaltenorientierten Versionen in Delta Lake mit Parquet‑Dateien. Diese Dual‑Tier‑Aufteilung optimiert sowohl die Abfragelatenz als auch die Speicher­kosten unabhängig voneinander.

Drittens ermöglicht ein temporäres Routing von Abfragen die punktgenaue Wiederherstellung von Wissen zu jedem beliebigen Zeitpunkt. Durch Delta‑Versionierung bleibt die ACID‑Konsistenz über beide Ebenen hinweg erhalten.

In einer Evaluierung mit 100 Dokumenten, die über fünf Zeitpunkte hinweg versioniert wurden, zeigte LiveVectorLake beeindruckende Ergebnisse: Nur 10‑15 % der Inhalte mussten bei Updates neu verarbeitet werden, im Vergleich zu 100 % bei vollständiger Neuindexierung. Die Abfragezeit für aktuelles Wissen blieb unter 100 ms, während temporäre Abfragen weniger als 2 s benötigten. Gleichzeitig senkte die Trennung von heißem und kaltem Speicher die Kosten, indem nur aktuelle Chunks im kostenintensiven Vektor‑Index gehalten wurden.

LiveVectorLake bietet damit eine robuste Lösung für Produktions‑RAG‑Deployments, die gleichzeitig schnelle Suchergebnisse, vollständige Versionshistorie und effiziente Speicher­nutzung erfordern.

Ähnliche Artikel