Hybrid-Modelle aus XGBoost und MLP verbessern Diabetesvorhersage bei NHANES-Daten
In einer neuen Veröffentlichung auf arXiv wird ein innovativer Ansatz vorgestellt, der bewährte Machine‑Learning‑Methoden auf die NHANES‑Gesundheitsdaten anwendet, um den Diabetesstatus vorherzusagen. Der Autor kombiniert einen XGBoost‑Feature‑Encoder mit einem schlanken Multilayer‑Perceptron (MLP), um die Vorhersagegenauigkeit zu steigern.
Zur Bewertung des Ansatzes wurden klassische Baseline‑Modelle – logistische Regression, Random Forest und XGBoost – mit dem hybriden Modell verglichen. Die Experimente zeigen, dass die Kombination aus XGBoost‑Encoder und MLP die AUC sowie die balancierte Genauigkeit deutlich über den Baselines liegt, wenn die NHANES‑Daten entsprechend vorverarbeitet wurden.
Der Beitrag geht über die reine Analyse hinaus: Der komplette Code sowie reproduzierbare Skripte werden öffentlich bereitgestellt, um die Ergebnisse zu validieren und die Methode in anderen Gesundheitsstudien zu übernehmen. Diese Offenheit fördert die Transparenz und erleichtert die Weiterentwicklung von Hybrid‑Modellen in der medizinischen Datenanalyse.