AutoML steigert Vorhersagegenauigkeit bei Hypothekenausfällen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Finanzwelt ist die Vorhersage von Hypothekenausfällen ein zentrales Thema für das Risikomanagement. Mit dem Aufkommen von Machine‑Learning‑Modellen gewinnen diese Verfahren zunehmend an Bedeutung, um Ausfallwahrscheinlichkeiten zu schätzen und verständliche Signale für nachfolgende Entscheidungen zu liefern.

Allerdings stellen drei Faktoren die Zuverlässigkeit von Modellen in realen Hypotheken‑Datensätzen häufig in Frage: die Mehrdeutigkeit bei der Kennzeichnung von Ausfällen, ein starkes Ungleichgewicht zwischen Ausfall‑ und Nicht‑Ausfall‑Beispielen sowie Informationslecks, die durch die zeitliche Struktur und nach Ereignis auftretende Variablen entstehen.

In einer vergleichenden Studie wurden verschiedene Machine‑Learning‑Ansätze anhand eines echten, auf Kredit‑Ebene aufgebauten Datensatzes getestet. Besonderes Augenmerk lag dabei auf der Kontrolle von Lecks und dem Umgang mit Ungleichgewichten. Dazu wurden leckensichere Feature‑Auswahlmethoden, ein striktes zeitliches Split‑Verfahren, das sowohl die Ausgabedaten als auch die Berichtszeiträume berücksichtigt, sowie gezielte Unterabtastung der Mehrheitsklasse eingesetzt.

Die Ergebnisse zeigen, dass die Modellleistung über unterschiedliche positive‑zu‑negative‑Verhältnisse hinweg stabil bleibt. Besonders hervorzuheben ist die AutoML‑Lösung AutoGluon, die mit dem höchsten AUROC unter den getesteten Modellen abschneidet.

Eine erweiterte und didaktische Version dieser Arbeit wird als Kapitel in einem kommenden Buch erscheinen.

Ähnliche Artikel