Neues Chunking-Verfahren verbessert Retrieval-Augmented Generation um 12 %
In der Welt der Retrieval-Augmented Generation (RAG) stellt die Fragmentierung von Wissen über mehrere Dokumente hinweg ein großes Problem dar. Ein neues Verfahren namens Cross-Document Topic-Aligned Chunking (CDTA) löst dieses Problem, indem es die Inhalte eines gesamten Korpus zusammenführt und in thematisch abgestimmte, informationsdichte Blöcke umwandelt.