Neues Paradigma: Companion Agents verbessern Text‑zu‑SQL bei fehlenden Daten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In der Welt der Text‑zu‑SQL‑Systeme ist die Genauigkeit stark von vollständigen und fehlerfreien Datenbankannotationen abhängig. Doch in realen Unternehmensumgebungen fehlen häufig solche Annotationen oder sind unvollständig. Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz präsentiert deshalb ein innovatives Konzept namens Companion Agents (CA), das genau dieses Problem angeht.

Die Idee hinter CA ist simpel, aber wirkungsvoll: Statt bei jeder Abfrage auf externe Quellen zuzugreifen, werden relevante Informationen bereits vorab im Datenbanksystem „cacht“. Die Companion Agents durchsuchen die Tabellenstruktur, extrahieren versteckte Beziehungen zwischen Tabellen, analysieren Werteverteilungen, statistische Muster und sogar latente semantische Hinweise. Auf diese Weise steht bei der eigentlichen Abfrage ein reichhaltiger Wissenspool zur Verfügung, der die Genauigkeit der SQL‑Generierung erheblich steigert.

Die Ergebnisse sprechen für sich. In umfangreichen Tests auf dem BIRD‑Benchmark, bei dem sämtliche Annotationen bewusst entfernt wurden, erzielte das CA‑Paradigma deutliche Verbesserungen: Die Ausführungsgenauigkeit stieg um 4,49 Punkte bei RSL‑SQL, 4,37 Punkte bei CHESS und beeindruckende 14,13 Punkte bei DAIL‑SQL. Besonders in den anspruchsvolleren Teilmengen konnten die Gewinne noch höher ausfallen – bis zu 16,71 Punkte. Diese Zahlen zeigen, dass Companion Agents ein vielversprechender Ansatz sind, um Text‑zu‑SQL in realen, datenarmen Szenarien praktikabler zu machen.

Ähnliche Artikel