KI erkennt soziale Determinanten von Gesundheit – 89 % F1 bei MIMIC‑III
Soziale Determinanten von Gesundheit (SDoH) haben einen großen Einfluss auf die Behandlungsergebnisse von Patienten, werden aber selten in strukturierten Daten erfasst. In den letzten Jahren hat die Forschung verstärkt darauf abgezielt, diese wichtigen Faktoren automatisch aus klinischen Texten zu extrahieren, um Diagnosesysteme mit dem sozialen Kontext der Patienten zu ergänzen.
Große Sprachmodelle zeigen bereits beeindruckende Leistungen bei der Identifikation von SDoH‑Labels in einzelnen Sätzen. Die Herausforderung besteht jedoch darin, diese Erkenntnisse in langen Aufnahme- oder Langzeitnotizen zu nutzen, wo lange Abhängigkeiten bestehen. In der vorliegenden Studie wurde die Klassifikation von SDoH‑ICD‑9‑Codes für Krankenhausaufenthalte im MIMIC‑III‑Datensatz untersucht, wobei sowohl klassische große Sprachmodelle als auch sogenannte Reasoning‑Modelle eingesetzt wurden.
Durch die Nutzung vorhandener ICD‑9‑Codes als Ausgangspunkt erreichte das Modell einen F1‑Score von 89 %. Die Arbeit liefert zudem wichtige Erkenntnisse über fehlende SDoH‑Codes in 139 Aufnahmen und stellt den Code zur Reproduzierbarkeit der Ergebnisse bereit, was die Transparenz und Weiterentwicklung in diesem Forschungsfeld fördert.