Neues Verfahren steigert Diagnosegenauigkeit bei seltenen Krankheiten
In einer aktuellen Studie wurde ein neues Verfahren zur Klassifikation unter extremen Klassenungleichgewichten vorgestellt, das besonders in medizinischen Diagnoseanwendungen von Bedeutung ist. Hierbei stehen sowohl die Erkennungsrate (Recall) als auch die Kalibrierung der Vorhersagen im Fokus.
Das vorgeschlagene Verfahren, AF‑SMOTE, kombiniert mathematisch fundierte Datenaugmentation mit einem zweistufigen Filterprozess. Zunächst werden synthetische Minderheitsdaten erzeugt. Anschließend filtert ein adversarialer Diskriminator in Kombination mit einem Grenz-Nutzenmodell diese Punkte, um die Qualität der Daten zu sichern.
Die Autoren konnten nachweisen, dass dieser Filter unter milden Annahmen zur Glattheit der Entscheidungsgrenze und zu den bedingten Dichten die Surrogatfunktion von Fβ (β ≥ 1) monoton verbessert, ohne die Brier‑Score‑Kalibrierung zu verschlechtern. Auf den Benchmark‑Datensätzen MIMIC‑IV (Proxy‑Label‑Vorhersage) und klassischen Betrugserkennungsaufgaben erzielte AF‑SMOTE höhere Recall‑ und durchschnittliche Präzisionswerte als etablierte Oversampling‑Methoden wie SMOTE, ADASYN, Borderline‑SMOTE und SVM‑SMOTE. Zudem zeigte es die beste Kalibrierung.
Die Leistungssteigerungen wurden zudem auf mehreren weiteren Datensätzen bestätigt. Besonders hervorzuheben ist die praktische Anwendung von AF‑SMOTE auf einem klinischen Datensatz, bei dem ein Proxy‑Label verwendet wurde. Diese Demonstration unterstreicht den Nutzen des Ansatzes in der medizinischen Praxis, wo das Fehlen echter Positivfälle bei seltenen Erkrankungen schwerwiegende Folgen haben kann.