Neues generatives Modell schützt Patientendaten und verbessert Langzeitdiagnosen
Die Nutzung elektronischer Patientenakten hat die medizinische Forschung revolutioniert, doch gleichzeitig stellen strenge Datenschutzgesetze ein großes Hindernis dar. Ein neues generatives Modell namens DP‑TimeGAN löst dieses Problem, indem es synthetische Zeitreihen erzeugt, die sowohl die klinische Aussagekraft als auch die Privatsphäre der Patienten wahren.
Im Gegensatz zu bisherigen Ansätzen, die bei Zeitreihen oft an ihre Grenzen stoßen oder keine klaren Datenschutzgarantien bieten, kombiniert DP‑TimeGAN ein fortschrittliches Zeitreihenmodell mit quantifizierbaren Privatschutzmechanismen. Durch die Integration von Differential Privacy wird sichergestellt, dass einzelne Patientendaten nicht zurückverfolgt werden können, während gleichzeitig die statistische Struktur der Originaldaten erhalten bleibt.
Die Wirksamkeit des Modells wurde anhand von realen Datensätzen aus der chronischen Nierenerkrankung und Intensivpflege getestet. In einer Train‑on‑Synthetic‑Test‑on‑Real‑Studie übertraf das nicht‑private Augmented TimeGAN mehrere Transformer‑ und Flow‑Modelle in statistischen Kennzahlen. Das private DP‑TimeGAN erzielte eine Authentizitätsrate von 0,778 auf dem CKD‑Datensatz und übertraf damit den aktuellen Stand der Technik im Bereich Datenschutz‑Effizienz.
Wichtig ist, dass beide Modelle in klinischen Bewertungen die Leistung realer Daten nahezu exakt reproduzieren. Damit liefert DP‑TimeGAN robuste, datenschutzkonforme Trainingsmaterialien, die die Entwicklung von KI‑Modellen für komplexe chronische Erkrankungen ermöglichen, ohne die Privatsphäre der Patienten zu gefährden.