Transport Clustering: Effiziente Lösung für Low‑Rank Optimal Transport
Optimal Transport (OT) liefert den kostengünstigsten Transportplan zwischen zwei Wahrscheinlichkeitsverteilungen. Im Gegensatz zum klassischen OT, das punktweise Zuordnungen herstellt, beschränkt Low‑Rank OT die Rangstruktur des Transportplans. Dadurch wird die statistische Stabilität erhöht, robuste Schätzungen von Wasserstein‑Entfernungen ermöglicht und K‑Means auf Co‑Clustering erweitert.
Die Rangbeschränkung macht das Problem jedoch nicht konvex und NP‑schwer. Die neue Methode Transport Clustering löst dieses Problem, indem sie Low‑Rank OT in ein Clustering‑Problem überführt. Zunächst wird ein vollrangiger Transport‑Registrierungsschritt durchgeführt, um mögliche Zuordnungen zu generieren. Anschließend werden diese Zuordnungen in Cluster gruppiert, was die ursprüngliche Optimierung drastisch vereinfacht.
Für negative‑Typ‑Metriken liefert der Ansatz eine (1 + γ)-Approximation, und für Kernel‑Kosten eine (1 + γ + √(2γ))-Approximation, wobei γ die Genauigkeit der vollrangigen Lösung im Verhältnis zur Low‑Rank‑Optimalität angibt. Diese Resultate zeigen, dass Transport Clustering polynomialzeitlich arbeitet und konstante Faktor‑Annäherungen garantiert.
In Experimenten übertraf Transport Clustering bestehende Low‑Rank‑OT‑Solver sowohl bei synthetischen Benchmarks als auch bei großen, hochdimensionalen Datensätzen. Die Kombination aus theoretischer Sicherheit und praktischer Effizienz macht die Methode zu einem vielversprechenden Werkzeug für Anwendungen, die robuste Transport‑Lösungen erfordern.