LightSearcher: Effiziente DeepSearch-Strategie mit Erfahrungs‑Speicher

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

DeepSearch‑Modelle ermöglichen es KI-Systemen, externe Suchwerkzeuge zu nutzen, um aktuelle, domänenspezifische Informationen abzurufen und damit die Genauigkeit ihrer Argumentation zu erhöhen. Durch den Einsatz von Reinforcement‑Learning können diese Modelle jedoch oft ein Spannungsfeld zwischen Genauigkeit und Effizienz aufbauen: Häufige Tool‑Aufrufe verbessern die Faktenkonsistenz, führen aber zu unnötigem Rechenaufwand.

LightSearcher löst dieses Problem, indem es einen lernbasierten Ansatz kombiniert, der auf Erfahrungs‑Speicher zurückgreift. Das System lernt kontrastive Argumentationspfade, um erfolgreiche Denkstrategien in leicht verständliche Zusammenfassungen zu überführen. Zusätzlich nutzt es ein adaptives Belohnungs‑Shaping, das redundante Tool‑Aufrufe nur dann bestraft, wenn die Antwort korrekt ist. Auf diese Weise wird die Balance zwischen Genauigkeit und Effizienz optimal gehalten.

In Experimenten an vier Multi‑Hop‑QA‑Benchmarks zeigte LightSearcher, dass die Genauigkeit mit dem aktuellen Stand‑der‑Kunst‑Baseline ReSearch vergleichbar bleibt, während die Anzahl der Tool‑Aufrufe um 39,6 % reduziert, die Inferenzzeit um 48,6 % und der Token‑Verbrauch um 21,2 % gesenkt werden konnten. Diese Ergebnisse unterstreichen die überlegene Effizienz des neuen Ansatzes.

Ähnliche Artikel