Maschinelles Lernen prognostiziert Herzkrankheiten bei Diabetikern – 90 % Genauigkeit
Ein neues Forschungsprojekt aus dem arXiv-Repository präsentiert ein hochpräzises Modell zur Vorhersage von Herz-Kreislauf-Erkrankungen bei Menschen mit Diabetes. Durch den Einsatz moderner Machine‑Learning‑ und Deep‑Learning‑Techniken konnte die Studie eine Genauigkeit von 90,5 % erreichen.
Die Analyse basiert auf dem BRFSS‑Datensatz, der zunächst von Duplikaten befreit, fehlende Werte behandelt und die Merkmale in kategoriale sowie numerische Gruppen eingeteilt wurde. Anschließend wurden mit Principal Component Analysis (PCA) die wichtigsten Faktoren extrahiert, um die Daten für die Modellierung zu optimieren.
Unter den klassischen Machine‑Learning‑Algorithmen erzielte XGBoost die beste Leistung mit einer Genauigkeit von 0,9050. Weitere Modelle wie Entscheidungsbäume, Random Forest, k‑Nearest Neighbors, Support Vector Machine, AdaBoost und XGBoost wurden ebenfalls getestet, wobei XGBoost die Nase vorn hatte.
Im Bereich Deep Learning wurden neuronale Netze, rekurrente Netze, Convolutional Neural Networks sowie Long‑Short‑Term‑Memory‑Modelle (LSTM) und deren Varianten (BiLSTM, GRU) eingesetzt. Besonders das LSTM‑Modell erreichte ebenfalls eine Genauigkeit von 0,9050 und erzielte bei einigen Varianten einen perfekten Recall von 1,00.
Die Ergebnisse zeigen, dass sowohl klassische als auch tiefgehende Lernmodelle zuverlässig das Risiko von Herz-Kreislauf-Erkrankungen bei Diabetikern vorhersagen können. Mit hohen Genauigkeits- und F1‑Scores bieten diese Ansätze ein starkes Potenzial, die klinische Entscheidungsfindung zu automatisieren und personalisierte Präventionsstrategien zu entwickeln.