Neues Verfahren: Decomposable Neuro Symbolic Regression erklärt komplexe Systeme

arXiv – cs.LG Original ≈2 Min. Lesezeit
Anzeige

Symbolic Regression (SR) versucht, aus Messdaten mathematische Ausdrücke zu finden, die die zugrunde liegenden Zusammenhänge beschreiben. Traditionell liegt der Fokus dabei auf der Minimierung von Vorhersagefehlern, wodurch die resultierenden Formeln oft zu kompliziert oder ungenau werden. Das neue Verfahren „Decomposable Neuro Symbolic Regression“ löst dieses Problem, indem es erklärbare, mehrdimensionale Ausdrücke erzeugt, die die Struktur des zugrunde liegenden Modells widerspiegeln.

Der Ansatz kombiniert moderne Transformer‑Modelle, genetische Algorithmen (GA) und genetische Programmierung (GP). Zunächst wird ein Multi‑Set Transformer eingesetzt, um mehrere ein‑variable symbolische Skelett‑Modelle zu generieren, die zeigen, wie jede Variable die Antwort des „undurchsichtig“ trainierten Regressionsmodells beeinflusst. Anschließend bewertet ein GA‑basierter Auswahlmechanismus die Qualität dieser Skelett‑Modelle und wählt die vielversprechendsten Kandidaten aus.

Die ausgewählten Skelett‑Modelle werden dann schrittweise mittels einer GP‑basierten Kaskaden‑Prozedur zu einem vollständigen mehrdimensionalen Ausdruck zusammengeführt, wobei die ursprüngliche Struktur jedes Skeletts erhalten bleibt. Abschließend optimiert ein weiterer GA die Koeffizienten, um die Genauigkeit der endgültigen Formel zu maximieren.

In umfangreichen Tests mit Daten, die unterschiedlichen Rausch‑Graden unterliegen, zeigte das Verfahren interpolierende und extrapolierende Fehler, die gleich oder besser waren als die von zwei reinen GP‑Methoden, drei neuronalen SR‑Ansätzen und einem hybriden Verfahren. Im Gegensatz zu diesen Modellen gelang es dem neuen Ansatz, Ausdrücke zu lernen, die exakt der ursprünglichen mathematischen Struktur entsprachen, und damit eine höhere Interpretierbarkeit und Zuverlässigkeit zu gewährleisten.

Ähnliche Artikel