SX-GeoTree: Entscheidungsbaum mit räumlich erklärbarer Georegression
Der neue SX‑GeoTree ist ein selbst erklärender Regressionsbaum, der räumliche Abhängigkeiten und stabile Erklärungen in einem Modell vereint. Durch die gleichzeitige Optimierung von Fehlerreduktion, räumlicher Residualkontrolle (Moran‑I) und Erklärungsrobustheit mittels Modularity‑Maximierung entsteht ein Baum, der nicht nur präzise Vorhersagen liefert, sondern auch lokal konsistente Feature‑Attributions‑Erklärungen erzeugt.
Der Ansatz nutzt ein Konsens‑Ähnlichkeitsnetzwerk, das aus zwei Quellen besteht: den Distanzmaßen der lokal gewichteten Regressionskoeffizienten (GWR) und den SHAP‑Attributionsdistanzen. Durch die Umwandlung der lokalen Lipschitz‑Kontinuität in ein Community‑Erhaltungsproblem kann die räumliche Kohärenz der Erklärungen ohne aufwändige Nachbarschaftssuchen skaliert werden.
In zwei Praxisbeispielen – dem Bruttoinlandsprodukt der 83 Landkreise Fujians und den 21.613 Hauspreisen in Seattle – zeigte SX‑GeoTree eine Genauigkeit, die nur um 0,01 $R^2$ hinter klassischen Entscheidungsbäumen zurückbleibt. Gleichzeitig verbesserte sich die räumliche Gleichmäßigkeit der Residuen deutlich, und die Konsistenz der Attributions‑Erklärungen verdoppelte sich (Modularity: Fujian 0,19 vs. 0,09; Seattle 0,10 vs. 0,05).
Eine Ablationsanalyse bestätigt, dass sowohl der Moran‑I‑Term als auch die Modularity‑Optimierung komplementär wirken; das Entfernen eines dieser Elemente führt zu schlechteren räumlichen Residuen und weniger stabilen Erklärungen.
Der SX‑GeoTree demonstriert, wie räumliche Ähnlichkeit – über geometrische Nähe hinaus durch GWR‑basierte lokale Beziehungen erweitert – in interpretierbare Modelle integriert werden kann, und trägt damit zur vertrauenswürdigen Analyse geographischer Daten bei.