Interpretierbarkeit von Modellen verbessert Text‑zu‑SQL‑Aufgaben
Forscher haben ein neues Modell namens CESQL vorgestellt, das die Genauigkeit von Text‑zu‑SQL‑Übersetzungen deutlich steigert. Durch die Kombination von Interpretierbarkeitsanalysen mit einer auf Ausführung basierenden Strategie für die semantische Analyse von WHERE‑Klauseln können die Modelle präziser und transparenter arbeiten.
Das Vorgehen umfasst zusätzlich Filteranpassungen, Verfeinerungen logischer Korrelationen und die Fusion mehrerer Modelle. Diese Elemente zusammen ermöglichen eine bedingte Verbesserung der Abfrageergebnisse, ohne dass die Modelle stark von den Daten in den Bedingungsspalten abhängig sind.
Auf dem WikiSQL‑Datensatz, der typische Single‑Table‑Abfragen repräsentiert, erzielt CESQL signifikante Genauigkeitssteigerungen. Die Ergebnisse zeigen, dass die Abhängigkeit von manuell gelabelten Trainingsdaten reduziert und die Leistung bei der Vorhersage von Bedingungswerten verbessert wird.
Die Arbeit liefert neue Perspektiven für die Forschung an komplexen Abfragen und Szenarien mit unregelmäßigen Daten in realen Datenbankumgebungen. Sie legt damit einen wichtigen Grundstein für die Weiterentwicklung von Text‑zu‑SQL‑Systemen in der Praxis.