VertCoHiRF: Dezentrales vertikales Clustering ohne zentrale Koordination
Vertikales Federated Learning (VFL) ermöglicht es Unternehmen, Daten mit komplementären Feature‑Sätzen gemeinsam zu analysieren, ohne ihre Rohdaten preiszugeben. Bisher beschränkten sich die meisten Ansätze jedoch auf verteilte Varianten von k‑means, die zentrale Koordination oder den Austausch von feature‑abhängigen Statistiken erfordern und bei heterogenen Sichtweisen oder böswilligem Verhalten an Robustheit verlieren.
Mit VertCoHiRF wird dieses Problem gelöst: Das neue Framework arbeitet vollständig dezentral und nutzt strukturelle Konsensbildung über heterogene Ansichten. Jeder Agent wendet ein lokales Clustering an, das speziell auf seinen eigenen Feature‑Space zugeschnitten ist, und tauscht anschließend nur Identifikatoren, Cluster‑Labels und Ranglisten aus. Auf diese Weise entsteht ein gemeinsames, hierarchisches Clustering ohne zentrale Server und ohne die Notwendigkeit, sensible Feature‑Informationen zu teilen.
Der Konsens wird durch dezentrale ordinal Ranking‑Algorithmen erreicht, die repräsentative Medoids auswählen und schrittweise eine Cluster‑Fusion‑Hierarchie (CFH) bilden. Diese CFH bietet eine leicht interpretierbare Darstellung der Übereinstimmung zwischen den Agenten auf mehreren Auflösungen und garantiert gleichzeitig Datenschutz durch Design, da ausschließlich Identifikatoren und Ranglisten kommuniziert werden.
Analysen der Kommunikationskomplexität und Robustheit zeigen, dass VertCoHiRF nicht nur effizient, sondern auch widerstandsfähig gegenüber heterogenen Daten und adversarialen Angriffen ist. Experimentelle Ergebnisse belegen, dass das Verfahren in vertikalen federated Settings eine mit k‑means vergleichbare, wenn nicht sogar bessere Cluster‑Qualität erzielt, und damit einen wichtigen Schritt in Richtung praktikabler, datenschutzfreundlicher kollaborativer Analyse darstellt.