FEAML: Automatisierte Feature‑Engineering‑Methode verbessert Multi‑Label‑Klassifikation

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Verfahren namens Feature Engineering Automation for Multi‑Label Learning (FEAML) nutzt die Code‑Generierungsfähigkeiten großer Sprachmodelle, um für Multi‑Label‑Klassifikationsaufgaben hochwertige Features zu erzeugen. Durch die Kombination von Metadaten und Label‑Koinzidenz‑Matrix wird das Modell dazu angeregt, die Beziehungen zwischen Datenmerkmalen und den Ziel‑Labels zu verstehen. Anschließend werden die generierten Features anhand der Modell‑Genauigkeit bewertet und mit Pearson‑Korrelationskoeffizienten auf Redundanz geprüft.

FEAML integriert ein Feedback‑Schleifen‑System, bei dem die Bewertungsergebnisse genutzt werden, um die Code‑Generierung in folgenden Iterationen zu optimieren. So entsteht ein selbstverbesserndes, interpretierbares und effizientes Feature‑Engineering‑Paradigma, das speziell auf die Komplexität von Multi‑Label‑Aufgaben zugeschnitten ist.

Experimentelle Tests auf verschiedenen Multi‑Label‑Datensätzen zeigen, dass FEAML bestehende Feature‑Engineering‑Methoden übertrifft. Das Verfahren demonstriert damit, wie große Sprachmodelle nicht nur Text, sondern auch strukturierte Daten für anspruchsvolle Klassifikationsaufgaben intelligent verarbeiten können.

Ähnliche Artikel