Differential Evolution optimiert Feature‑Auswahl in Datenströmen
In einer kürzlich veröffentlichten Studie auf arXiv wird die neue Methode ODESFS vorgestellt, die die Auswahl von Merkmalen in hochdimensionalen Datenströmen verbessert. ODESFS kombiniert eine fortschrittliche Imputation fehlender Werte mit einer Differential‑Evolution‑Strategie, um die wichtigsten Features zu identifizieren.
Traditionelle Online‑Feature‑Selection‑Techniken (OSFS) stoßen häufig an ihre Grenzen, wenn Daten unvollständig sind – etwa durch Ausfälle von Messgeräten oder technische Einschränkungen. Die bisherige Variante OS2FS nutzt latente Faktoranalysen zur Schätzung fehlender Werte, doch ihre Bewertung der Feature‑Relevanz bleibt schwach, was die Gesamtleistung beeinträchtigt.
ODESFS löst dieses Problem, indem es zunächst fehlende Werte mithilfe eines latenten Faktor‑Modells präzise imputiert. Anschließend bewertet ein Differential‑Evolution‑Algorithmus die Bedeutung jedes Merkmals und wählt so ein optimales Subset aus. Diese Kombination ermöglicht eine robustere und effizientere Feature‑Auswahl, selbst bei stark fehlenden Daten.
Umfangreiche Experimente an sechs realen Datensätzen zeigen, dass ODESFS die führenden OSFS‑ und OS2FS‑Methoden übertrifft. Die Methode erzielt nicht nur höhere Genauigkeit, sondern wählt auch kompaktere Feature‑Sets, was die Verarbeitungsgeschwindigkeit in Echtzeit‑Anwendungen verbessert.