RE-Tab: Verbessert TableQA durch verifizierbare Rückmeldungen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Die Entwicklung von TableQA-Agenten steht vor einer besonderen Herausforderung: Antworten lassen sich nicht sofort aus einer statischen Tabelle ableiten, sondern erfordern schrittweise Transformationen des Tabelleninhalts. Diese mehrstufige Logik erhöht die Komplexität und erfordert Interaktion mit der Umgebung.

Um diese Hürde zu überwinden, stellt das neue Framework RE‑Tab vor, das als Plug‑and‑Play-Lösung konzipiert ist. RE‑Tab nutzt ein leichtgewichtiges, trainingsfreies Reward‑Modell, das die Problemstellung als Partially Observable Markov Decision Process (POMDP) formuliert und so die Trajektoriensuche in Tabellenzuständen verbessert.

Der Schlüssel liegt in expliziten, verifizierbaren Belohnungen, die während der Zustandsübergänge („Welche Aktion ist am besten?“) und der simulierten Begründung („Bin ich sicher über das Ergebnis?“) abgegeben werden. Diese Rückmeldungen lenken die Agenten gezielt durch die Tabellenlandschaft und fördern schrittweise, nachvollziehbare Entscheidungen.

Die Ergebnisse sind beeindruckend: RE‑Tab erreicht einen branchenführenden Stand in TableQA, reduziert die Inferenzkosten um fast 25 % und steigert die Genauigkeit der Fragen‑Antworten um 41,77 %. Gleichzeitig sinkt die Anzahl der Test‑Zeit‑Inferenzproben um 33,33 %, was zu konsistenteren Antworten führt.

Die Verbesserungen zeigen sich konsistent über verschiedene große Sprachmodelle und aktuelle Benchmarks hinweg, was die Generalisierbarkeit von RE‑Tab unterstreicht. Das komplette Repository ist unter https://github.com/ThomasK1018/RE_Tab verfügbar.

Ähnliche Artikel