Neues Deep-Learning-Modell verbessert Clustering bei fehlenden Daten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Forscher haben ein innovatives Deep-Learning-Framework namens DIMVC-HIA vorgestellt, das die Analyse von Multi-View-Daten mit fehlenden Beobachtungen revolutioniert. Das System kombiniert hierarchische Imputation und semantische Ausrichtung, um die gemeinsamen Clusterstrukturen zuverlässig zu erkennen.

Das Modell nutzt vier zentrale Bausteine: Erstens werden für jede Ansicht eigene Autoencoder trainiert, die latente Merkmale extrahieren, während ein gemeinsamer Clustering-Predictor weiche Clusterzuweisungen liefert. Zweitens führt ein hierarchisches Imputationsmodul fehlende Clusterzuweisungen anhand kontrastiver Ähnlichkeiten zwischen den Ansichten schätzt und rekonstruiert anschließend fehlende Features mit Hilfe von intra- und interclusterstatistiken.

Drittens sorgt ein energiesystembasiertes Alignment dafür, dass Cluster intern kompakt bleiben, indem die Energievarianz um niedrigenergetische Clusteranker minimiert wird. Viertens stärkt ein kontrastives Zuordnungsalignment die Konsistenz über die Ansichten hinweg und fördert klare, gut getrennte Clustervorhersagen.

Experimentelle Tests auf Standard-Benchmarks zeigen, dass DIMVC-HIA bei unterschiedlichen Ausfallraten die Leistung anderer Methoden deutlich übertrifft. Das neue Verfahren bietet damit eine robuste Lösung für die Herausforderung, fehlende Daten in Multi-View-Umgebungen zu handhaben, ohne Bias einzuführen oder die semantische Kohärenz zu verlieren.

Ähnliche Artikel