Graphische Modelle steigern Dropout‑Vorhersage um 7 % – Studie zeigt

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Eine neue Untersuchung aus dem arXiv‑Repository zeigt, dass Graph Neural Networks (GNNs) die Vorhersage von Schulabbruchrisiken deutlich verbessern können. Durch die Umwandlung von tabellarischen Schülerdaten in graphische Strukturen – mithilfe von Clustering‑Methoden wie K‑Means und HDBSCAN sowie Dimensionenreduktion mit PCA und UMAP – konnten die Autoren die Leistungsfähigkeit von GNN‑Modellen mit klassischen Machine‑Learning‑Ansätzen vergleichen.

Die Studie testete zwei GNN‑Architekturen, ein maßgeschneidertes Graph Convolutional Network (GCN) und GraphSAGE, gegen etablierte tabellarische Modelle wie Random Forest, XGBoost und TabNet. Dabei zeigte sich, dass GraphSAGE auf einem aus PCA‑KMeans generierten Graphen die höchste Genauigkeit erzielte. Der Macro‑F1‑Score stieg um etwa sieben Prozentpunkte und die Gesamtgenauigkeit um knapp zwei Prozentpunkte im Vergleich zum besten tabellarischen Baseline‑Modell XGBoost.

Andere GNN‑Konfigurationen und Graphaufbau‑Strategien erzielten zwar ebenfalls Verbesserungen, konnten jedoch nicht konsequent die tabellarischen Modelle übertreffen. Die Ergebnisse unterstreichen, dass die Wahl der Graph‑Konstruktion entscheidend ist und dass nicht jede graphische Transformation automatisch zu besseren Vorhersagen führt.

Die Forschung liefert damit wertvolle Erkenntnisse für Bildungseinrichtungen, die frühzeitig gefährdete Schüler identifizieren und gezielte Unterstützungsmaßnahmen einleiten wollen. Durch den Einsatz von Graph‑basierten Modellen lassen sich komplexe Zusammenhänge in den Daten besser erfassen und die Prävention von Schulabbruch effektiver gestalten.

Ähnliche Artikel