BiPETE: Transformer-Encoder verbessert Risikovorhersage von Alkoholmissbrauch
Ein neues Transformer-basiertes Modell namens BiPETE (Bi-Positional Embedding Transformer Encoder) verspricht, die Vorhersage von Alkohol- und Substanzmissbrauch aus elektronischen Gesundheitsakten (EHRs) deutlich zu verbessern. Durch die Kombination von rotatorischen Positions-Embeddings, die die relative Zeit zwischen Arztbesuchen erfassen, und sinusoidalen Embeddings, die die Reihenfolge der Besuche bewahren, kann BiPETE die komplexen zeitlichen Abhängigkeiten in unregelmäßig strukturierten Daten adressieren.
Die Autoren trainierten BiPETE ohne umfangreiches Pretraining auf EHR-Daten zweier psychiatrischer Kohorten – Depression und posttraumatischer Belastungsstörung (PTSD). In beiden Gruppen zeigte das Modell eine signifikante Leistungssteigerung gegenüber etablierten Baselines: Der Bereich unter der Präzisions-Recall-Kurve (AUPRC) wuchs um 34 % bei der Depressionskohorte und um 50 % bei der PTSD-Kohorte. Eine Ablationsstudie bestätigte, dass die doppelte Positionskodierung der Schlüssel zum Erfolg ist.
Zur Interpretation der Vorhersagen nutzten die Forscher die Integrated-Gradients-Methode. Dabei wurden wichtige klinische Merkmale identifiziert, die das Risiko für Alkohol- und Substanzmissbrauch erhöhen oder senken, darunter Entzündungs-, Hämatologie- und Stoffwechselmarker sowie bestimmte Medikamente und Begleiterkrankungen. Diese Erkenntnisse liefern nicht nur ein tieferes Verständnis des Risikoprozesses, sondern geben auch wertvolle Hinweise für präventive Maßnahmen.
Insgesamt stellt BiPETE einen praxisnahen und interpretierbaren Ansatz für die Krankheitsrisikovorhersage aus EHR-Daten dar und könnte die Früherkennung von Alkohol- und Substanzmissbrauch in der klinischen Praxis erheblich verbessern.