DiagECG: LLM‑gestütztes Framework für diagnostische Analyse von EKGs
Die neue Methode DiagECG verbindet Zeitreihenanalyse mit Sprachmodellierung und ermöglicht es großen Sprachmodellen, 12‑Leads‑EKG‑Signale für klinische Textgenerierung zu verarbeiten. Durch die Diskretisierung der kontinuierlichen EKG‑Einbettungen in symbolische Token – mittels eines lead‑unabhängigen Encoders und eines Quantisierungsmoduls – wird das Vokabular des Modells erweitert. So kann das Modell sowohl EKG‑ als auch natürliche Sprachdaten in einer einheitlichen Weise verarbeiten.
Um die Modalitätslücke zu überbrücken, wird das Modell zunächst auf einer autoregressiven EKG‑Vorhersageaufgabe vortrainiert. Dadurch lernt das Sprachmodell die zeitlichen Dynamiken der EKG‑Signale mit seinen eigenen Sprachmodellierungsfähigkeiten zu modellieren. Anschließend erfolgt ein Instruction‑Tuning für EKG‑Frage‑Antworten und die Erstellung diagnostischer Berichte.
Ohne Änderungen am Kernmodell erzielt DiagECG starke Leistungen über verschiedene Aufgaben hinweg und bleibt dabei robust gegenüber Out‑of‑Distribution‑Daten. Umfangreiche Experimente belegen die Wirksamkeit jedes einzelnen Bestandteils und zeigen das enorme Potenzial auf, symbolische EKG‑Repräsentationen in große Sprachmodelle zu integrieren – ein bedeutender Schritt für die medizinische Entscheidungsfindung.