Distribution-Conditioned Transport: Generalisierbare Transportmodelle

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der modernen Datenanalyse besteht die Herausforderung, Transportmodelle zu entwickeln, die nicht nur bekannte Quell- und Zielverteilungen abbilden, sondern auch auf völlig neue, während des Trainings nicht beobachtete Verteilungspaare generalisieren können. Das neue Konzept des Distribution-Conditioned Transport (DCT) adressiert dieses Problem, indem es Transportkarten auf lernte Embeddings der jeweiligen Verteilungen konditioniert.

DCT ermöglicht zudem semi‑supervised Lernansätze für Vorhersagen, bei denen nur eine der beiden Bedingungen beobachtet wird. Durch die Unabhängigkeit von konkreten Transportmechanismen – sei es Flow‑Matching, Wasserstein‑ oder MMD‑basierte Modelle – lässt sich die Methode flexibel in bestehende Pipelines integrieren.

Die Autoren demonstrieren die Leistungsfähigkeit von DCT zunächst an synthetischen Benchmarks und anschließend an vier biologischen Anwendungsfällen: der Übertragung von Batch‑Effekten in Single‑Cell‑Genomik, der Vorhersage von Störungen aus Mass‑Cytometry‑Daten, dem Lernen clonaler Transkriptionsdynamiken in der Hämatopoese sowie der Modellierung der Evolution von T‑Zell‑Rezeptor‑Sequenzen. Die Ergebnisse zeigen deutliche Verbesserungen gegenüber herkömmlichen Transportmethoden und eröffnen neue Perspektiven für die Analyse komplexer, verteilungsbasierter Daten.

Ähnliche Artikel