AutoML und SHAP enthüllen Schlüsselfaktoren für schwere Autounfälle in Ohio

arXiv – cs.LG Original ≈2 Min. Lesezeit
Anzeige

Motorfahrzeugunfälle zählen weltweit zu den Hauptursachen für Verletzungen und Todesfälle. Um die Schwere solcher Unfälle besser zu verstehen und zu reduzieren, hat ein neues Forschungsprojekt ein umfangreiches Datenset aus Ohio zusammengestellt. Das Set umfasst mehr als drei Millionen Beteiligte an Unfällen zwischen 2017 und 2022 und über 2,3 Millionen Fahrzeug‑Level‑Einträge, die für die Analyse zur Verfügung stehen.

Die Studie verfolgt einen transparenten und reproduzierbaren Ansatz, der automatisiertes maschinelles Lernen (AutoML) mit erklärbarer künstlicher Intelligenz kombiniert. Auf der Plattform JADBio wurden Modelle entwickelt, die zwischen schweren und nicht‑schweren Unfällen unterscheiden. Durch eine sorgfältige Feature‑Auswahl in stratifizierten Trainings‑Subsets und die anschließende Interpretation mit SHapley Additive Explanations (SHAP) konnten die wichtigsten Einflussfaktoren identifiziert und quantifiziert werden.

Das finale Modell – eine Ridge‑Logistische Regression – erreichte auf dem Trainings‑Set einen AUC‑ROC von 85,6 % und auf einem hold‑out‑Test‑Set von 84,9 %. Siebenzehn Merkmale wurden als besonders einflussreich ermittelt. Zu den wichtigsten gehören Standorttyp, ausgeschriebene Höchstgeschwindigkeit, das Mindestalter der Insassen und das Verhalten vor dem Unfall. Interessanterweise spielten traditionell stark betonte Faktoren wie Alkohol‑ oder Drogenkonsum im Vergleich zu Umwelt‑ und Kontextvariablen eine geringere Rolle.

Die Ergebnisse unterstreichen die Bedeutung eines methodisch rigorosen Ansatzes und zeigen, dass Umwelt‑ und kontextbezogene Variablen entscheidend für die Unfallschwere sind. Diese Erkenntnisse können Entscheidungsträgern dabei helfen, gezielte Maßnahmen zur Unfallprävention zu entwickeln und die Verkehrssicherheit nachhaltig zu verbessern.

Ähnliche Artikel