Memo‑SQL: Trainingfreies NL2SQL mit Decomposition & selbstkorrigierendem Ansatz

arXiv – cs.AI Original ≈2 Min. Lesezeit
Anzeige

In der Welt der Natural‑Language‑to‑SQL‑Übersetzungen stoßen aktuelle Systeme an zwei Grenzen: Sie nutzen ausschließlich korrekte Beispiele für das In‑Context‑Learning und vernachlässigen damit wertvolle Hinweise aus historischen Fehler‑Korrektur‑Paaren. Gleichzeitig führen test‑zeitliche Skalierungsansätze zu willkürlichen Frageldecompositions, die fast identische SQL‑Kandidaten erzeugen und damit die Vorteile von Ensembles schwächen. Darüber hinaus gilt ein hartes Dilemma zwischen Genauigkeit und Rechenaufwand – hohe Leistungen erfordern enorme Ressourcen, während schnelle Varianten die Qualität stark reduzieren.

Memo‑SQL löst diese Probleme mit einem komplett training‑freien Ansatz, der auf zwei einfachen Prinzipien basiert: strukturierte Decomposition und erfahrungsbasierte Selbstkorrektur. Anstatt die Decomposition dem Zufall zu überlassen, setzt Memo‑SQL drei klare Strategien ein – entity‑wise, hierarchisch und atomar-sequentiell – um vielfältige Denkwege zu fördern. Für die Selbstkorrektur wird ein dynamischer Speicher aufgebaut, der sowohl erfolgreiche Abfragen als auch historische Fehler‑Korrektur‑Paarungen enthält. Durch retrieval‑augmentiertes Prompting werden relevante Beispiele zum Inferenzzeitpunkt ins Kontext gebracht, ohne dass ein Fine‑Tuning oder externe APIs nötig sind.

Auf dem BIRD‑Datensatz erzielt Memo‑SQL mit 68,5 % Ausführungsgenauigkeit einen neuen Stand der Technik unter Open‑Source‑Methoden ohne Fine‑Tuning. Gleichzeitig spart es mehr als das zehnfache an Rechenressourcen im Vergleich zu bisherigen Test‑Time‑Scaling‑Ansätzen. Memo‑SQL zeigt, dass durch gezielte Strukturierung und intelligente Nutzung historischer Erfahrungen selbst ein training‑freier Ansatz Spitzenleistungen erreichen kann.

Ähnliche Artikel