ECG-Agent: Der erste LLM-basierte Tool-Calling-Agent für mehrfache ECG-Dialoge
Mit den jüngsten Fortschritten multimodaler Large Language Models (LLMs) hat sich die Analyse von Elektrokardiogrammen (EKG) stark erweitert. Bisher konzentrierten sich die Modelle vor allem auf Klassifikationen, Berichtserstellungen und Einzelschritt-Frage‑Antwortaufgaben. In der Praxis fehlen jedoch wichtige Eigenschaften wie mehrfache Gesprächsführung, effiziente Ausführung auf Geräten und ein präzises Verständnis der EKG-Messwerte – insbesondere der PQRST‑Intervalle.
Um diese Lücken zu schließen, wurde der ECG‑Agent vorgestellt: der erste LLM-basierte Tool‑Calling-Agent, der speziell für mehrfache EKG‑Dialoge entwickelt wurde. Der Agent kann auf dem Gerät selbst laufen und nutzt dabei ein Tool‑Calling-Framework, um gezielt Messwerte zu analysieren und zu interpretieren.
Zur Unterstützung der Entwicklung und Bewertung wurde das neue ECG‑Multi‑Turn‑Dialogue (ECG‑MTD) Dataset veröffentlicht. Es enthält realistische, mehrfache Dialoge zwischen Nutzer und Assistenten für verschiedene EKG‑Lead‑Konfigurationen. Die Tests zeigen, dass die ECG‑Agents die Basis‑LLMs in der Antwortgenauigkeit deutlich übertreffen. Besonders beeindruckend ist, dass die auf dem Gerät laufenden Varianten nahezu die gleiche Leistung wie größere Modelle erzielen – sowohl bei der Genauigkeit der Antworten als auch bei der Fähigkeit, Tools korrekt einzusetzen und Halluzinationen zu vermeiden.
Diese Ergebnisse unterstreichen die Machbarkeit von ECG‑Agents für reale Anwendungen und markieren einen wichtigen Schritt hin zu intelligenten, konversationsfähigen EKG‑Analysewerkzeugen, die direkt auf Patienten‑Geräten eingesetzt werden können.