Elastic-Net-Multiple-Kernel-Learning: Mehrere Datenquellen für bessere Vorhersagen
In der neuesten Veröffentlichung auf arXiv wird ein innovatives Verfahren zur Kombination mehrerer Datenquellen vorgestellt, das die Leistungsfähigkeit von Machine‑Learning‑Modellen in der Neuroimaging‑Forschung deutlich steigert. Das Konzept des Multiple Kernel Learning (MKL) nutzt verschiedene Kernel, um unterschiedliche Datenrepräsentationen zu integrieren, und sucht eine optimale lineare Kombination dieser Kernel unter einer Regularisierung.
Der Fokus liegt auf dem Elastic‑Net‑Regularisierungsansatz, der sowohl die Sparsität des Modells (durch den l1‑Term) als auch die Stabilität bei korrelierten Kerneln (durch den l2‑Term) fördert. Diese Eigenschaft macht das Verfahren besonders wertvoll, wenn die Interpretierbarkeit des Modells entscheidend ist, etwa bei der Analyse von Gehirnscans.
Im Gegensatz zu bisherigen Methoden, die einen zweistufigen Prozess mit Gradient‑Descent oder Cutting‑Plane‑Algorithmen nutzen, bietet die neue ENMKL‑Formulierung eine analytische Update‑Regel für die Kernelgewichte. Damit lassen sich sowohl Support‑Vector‑Maschinen (SVM) als auch Kernel‑Ridge‑Regression (KRR) effizient trainieren. Die Autoren haben die Algorithmen in das Open‑Source‑Toolbox Pattern Recognition for Neuroimaging (PRoNTo) integriert.
Bei der Evaluation auf drei neuroimaging‑basierten Aufgaben zeigte ENMKL eine Leistung, die l1‑normen‑basierten MKL‑Modellen gleichkommt oder diese sogar übertrifft. Die Ergebnisse unterstreichen die Wirksamkeit des Elastic‑Net‑Ansatzes für die Kombination korrelierter Datenquellen und eröffnen neue Möglichkeiten für präzisere Vorhersagen in der medizinischen Bildgebung.