Bayessche Netzwerke kombinieren Text und Tabellen für präzise Patienteninfos
Elektronische Gesundheitsakten (EHR) sind ein unschätzbares Fundament für die Entwicklung klinischer Entscheidungsunterstützungssysteme. Um diese Systeme in Hochrisikobereichen effektiv einzusetzen, bedarf es umfangreicher, strukturierter Tabellendaten, die transparente, featurebasierte Modelle ermöglichen. Während ein Teil der EHR bereits strukturierte Informationen wie Diagnosecodes, Medikamente und Laborwerte enthält, liegt ein Großteil der relevanten Daten in unstrukturiertem Text – etwa in Entlassungsberichten und Pflegeprotokollen.
In der vorliegenden Arbeit wird ein multimodaler Ansatz zur patientenbezogenen Informationsgewinnung vorgestellt, der sowohl die vorhandenen tabellarischen Merkmale als auch die klinischen Notizen nutzt. Für die tabellarischen Daten wird ein Experten-gestütztes Bayessches Netzwerk eingesetzt, während die Textdaten mit neuronalen Klassifikatoren verarbeitet werden. Durch die Einführung von virtueller Evidenz und einem Konsistenzknoten entsteht eine interpretierbare, probabilistische Fusion der beiden Modellvorhersagen.
Der Konsistenzknoten verbessert die Kalibrierung der Endvorhersagen im Vergleich zu reiner virtueller Evidenz. Dadurch kann das Bayessche Netzwerk die Ausgaben des neuronalen Klassifikators besser anpassen, fehlende Informationen berücksichtigen und Widersprüche zwischen tabellarischen und textuellen Daten auflösen. Die Effektivität dieser Methode wird am SimSUM-Datensatz demonstriert, einem simulierten Benchmark, der tabellarische EHRs mit klinischen Notizen unter Einbeziehung von Expertenwissen verknüpft.