Deep Learning steigert Genauigkeit bei Sperm-Qualitätsbewertung mit WHO-Kriterien
Die Bewertung der Spermienmorphologie ist ein entscheidender, aber stark subjektiver Bestandteil der männlichen Fruchtbarkeitsdiagnostik. Inter‑Beobachtervariabilität und begrenzte Ressourcen erschweren eine konsistente Analyse. In einer neuen Studie wurde ein hochauflösendes Bild‑basierendes Deep‑Learning‑Modell namens HuSHeM mit einer klinisch fundierten Basis, die die WHO‑Kriterien um den Systemic Inflammation Response Index (SIRI) erweitert, gegenübergestellt.
HuSHeM wurde auf einer umfangreichen Bilddatenbank trainiert und anschließend an einer unabhängigen klinischen Kohorte validiert. Die Leistungsbewertung erfolgte anhand von Diskriminationsfähigkeit, Kalibrierung und klinischer Nutzenanalyse. Das Modell zeigte eine deutlich höhere Area Under the Curve (AUC) und eine engere Konfidenzintervallbreite als die WHO(+SIRI)-Baseline.
Darüber hinaus erzielte HuSHeM bessere Ergebnisse in der Precision‑Recall‑Analyse, was besonders bei Klassenungleichgewicht von Bedeutung ist. Die Kalibrierungsanalyse bestätigte eine engere Übereinstimmung zwischen vorhergesagten Wahrscheinlichkeiten und beobachteten Ergebnissen, während die Entscheidungsanalyse einen größeren netten klinischen Nutzen über relevante Schwellenwerte hinweg aufzeigte.
Diese Befunde deuten darauf hin, dass bildbasierte Deep‑Learning‑Ansätze eine verlässlichere und klinisch nutzbringendere Bewertung der Spermienmorphologie ermöglichen als traditionelle regelbasierte und entzündungsbasierte Kriterien. Das vorgestellte Framework unterstützt eine objektive, reproduzierbare und ressourcenschonende Analyse, die die männliche Fruchtbarkeitsdiagnostik nachhaltig verbessern könnte.