NSR-Boost: Neuro‑Symbolische Residual‑Boosting‑Lösung für Legacy‑Modelle
In der Industrie dominieren Gradient Boosted Decision Trees (GBDTs) bei tabellarischen Anwendungen, doch die Aktualisierung veralteter Modelle in hochlastigen Produktionsumgebungen bleibt mit hohen Retraining‑Kosten und systemischen Risiken verbunden. Das neue Framework NSR‑Boost löst dieses Problem, indem es Legacy‑Modelle unverändert lässt und gezielt die „harten“ Regionen repariert, in denen die Vorhersagen versagen.
Der Ansatz besteht aus drei klar definierten Schritten: Zunächst werden die problematischen Bereiche durch Analyse der Residuen identifiziert. Anschließend generiert ein Large Language Model (LLM) symbolische Code‑Strukturen, die als interpretierbare Experten dienen; deren Parameter werden mittels Bayesian Optimization feinjustiert. Abschließend werden die Experten dynamisch mit dem Ausgang des Legacy‑Modells über einen leichtgewichtigen Aggregator kombiniert.
NSR‑Boost wurde erfolgreich im Kern‑Risikokontrollsystem von Qfin Holdings eingesetzt. In Tests über sechs öffentliche Datensätze und ein privates Set übertrifft das System die aktuellen State‑of‑the‑Art‑Methoden deutlich und erzielt zudem signifikante Verbesserungen bei Live‑Online‑Daten. Besonders hervorzuheben ist die Fähigkeit, lange Schwanz‑Risiken aufzudecken, die herkömmliche Modelle übersehen.
Damit bietet NSR‑Boost ein sicheres, kostengünstiges und evolutionäres Paradigma für die Industrie, das Legacy‑Modelle ohne umfangreiche Neutrainings aufrüstet und gleichzeitig die Modellleistung nachhaltig steigert.