Transformer-Modell verbessert Schlafstadienklassifikation mit klinischen Daten
Die manuelle Schlafstadienklassifikation aus Polysomnographie (PSG) ist nicht nur zeitaufwendig, sondern auch von einer hohen Inter-Scorer-Variabilität geprägt. Obwohl moderne Deep‑Learning‑Modelle bereits Fortschritte bei der automatisierten Analyse erzielt haben, nutzen sie meist ausschließlich die rohen PSG‑Signale und vernachlässigen die kontextuellen Hinweise, die menschliche Experten bei ihrer Bewertung berücksichtigen.
In der vorliegenden Studie wurde ein zweistufiges Architekturmodell vorgestellt, das einen Transformer‑basierten Encoder für einzelne Epochendaten mit einem 1‑D‑CNN‑Aggregator kombiniert. Dabei werden systematisch zwei Arten von Kontextinformationen einbezogen: patientenspezifische klinische Metadaten (Alter, Geschlecht, BMI) sowie per‑Epochen‑basierte Expertenannotationen zu Apnoe, Desaturationen, Aufwachungen und periodischem Atmen.
Die Evaluation erfolgte anhand der Sleep Heart Health Study (SHHS) mit 8.357 Probanden. Durch die Integration der Kontextdaten stieg die Staging‑Genauigkeit signifikant: Der Macro‑F1‑Score verbesserte sich von 0,7745 auf 0,8031, während der Micro‑F1 von 0,8774 auf 0,9051 zunahm. Besonders die Einbindung der Ereignisanotationen trug den größten Anteil zu diesen Verbesserungen bei. Im Vergleich zu Multi‑Task‑Ansätzen, die dieselben Hilfslabels vorhersagen, zeigte die Feature‑Fusion eine überlegene Leistung.
Diese Ergebnisse verdeutlichen, dass die Ergänzung von lernbasierten Repräsentationen um klinisch relevante Features sowohl die Leistungsfähigkeit als auch die Interpretierbarkeit von Schlafstadienklassifikatoren erhöht – und das ohne Änderungen an der PSG‑Montage oder die Notwendigkeit zusätzlicher Sensoren. Die Studie legt damit einen praktischen und skalierbaren Weg für kontextbewusste, expertenorientierte Schlafanalyse‑Systeme nahe.