LLMs nutzen für strukturierte Datenextraktion aus Patientenakten
Die manuelle Durchsicht von Patientenakten bleibt ein zeitintensiver und ressourcenhungriger Prozess, der Fachleute dazu zwingt, komplexe Informationen aus unstrukturierten EHR‑Texten zu extrahieren. Ein neues, sicheres und modular aufgebautes System nutzt lokal ausgeführte große Sprachmodelle (LLMs), die auf institutionell genehmigten, HIPAA‑konformen Recheninfrastrukturen laufen.
Das Framework kombiniert Retrieval‑Augmented Generation (RAG) mit strukturierten Antwortmethoden der LLMs und ist in einem leicht deploybaren, skalierbaren Container verpackt. Damit kann es für verschiedenste klinische Fachgebiete strukturierte Merkmale aus klinischen Notizen extrahieren.
In der Evaluation zeigte das System eine hohe Genauigkeit bei der Erfassung mehrerer medizinischer Merkmale in umfangreichen Patientendaten. Darüber hinaus wurden Fehler in manuellen Annotationen entdeckt, die zuvor übersehen wurden. Das Ergebnis ist eine deutliche Entlastung der manuellen Chart‑Review‑Arbeit, eine höhere Konsistenz bei der Datenerfassung und eine beschleunigte Durchführung klinischer Studien.