DeepRead: Strukturierte Dokumentenlogik steigert agentische Suche
Ein neues Forschungsprojekt namens DeepRead hat gezeigt, dass die Berücksichtigung der natürlichen Struktur von Dokumenten die Leistung von agentischen Suchsystemen deutlich verbessert. Durch die Kombination von OCR‑Technologie und fortschrittlichen Retrieval‑Tools kann DeepRead lange PDFs in strukturierte Markdown‑Dateien umwandeln, wobei Überschriften und Absatzgrenzen erhalten bleiben.
Die Agenten‑Architektur von DeepRead nutzt zwei spezielle Werkzeuge: ein „Retrieve“-Tool, das relevante Absätze anhand ihrer strukturellen Koordinaten lokalisiert, und ein „ReadSection“-Tool, das es ermöglicht, zusammenhängende Textabschnitte in ihrer ursprünglichen Reihenfolge zu lesen. Diese beiden Funktionen arbeiten zusammen, um die Suche und das Lesen von Dokumenten effizienter zu gestalten.
Experimentelle Ergebnisse zeigen, dass DeepRead die Genauigkeit bei der Beantwortung von Fragen zu langen Dokumenten im Vergleich zu herkömmlichen agentischen Suchmethoden signifikant erhöht. Die Analyse des Verhaltens der Agenten bestätigt, dass die Kombination aus gezieltem Retrieval und strukturiertem Lesen die wichtigsten Erfolgsfaktoren ist.