BALANS: Skalierbare Batch‑Korrektur für Cell Painting mit lokalen Affinitäten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Cell Painting ist ein hochauflösendes Bildgebungsverfahren, das zelluläre Morphologie in detaillierten Profilen erfasst und damit die Wirkstoffforschung unterstützt. In großen Datensätzen treten jedoch häufig Batch‑Effekte auf, die durch unterschiedliche Labore, Geräte und Protokolle verursacht werden und die biologischen Signale verschleiern.

Um diese Verzerrungen zu beseitigen, hat ein Forschungsteam die Methode BALANS (Batch Alignment via Local Affinities and Subsampling) entwickelt. BALANS korrigiert die Daten, indem es eine geglättete Affinitätsmatrix aus Paarabständen erstellt. Dabei nutzt es zwei zentrale Ideen: Erstens wird für jedes Zellpaar ein lokaler Maßstab festgelegt, der auf dem Abstand zum k‑ten Nachbarn innerhalb des jeweiligen Batches basiert. Anschließend wird die Affinität mit einem Gauß‑Kernel berechnet, der diese batch‑sensitiven Skalen berücksichtigt.

Die zweite Innovation ist ein adaptives Sampling, das die Matrix sparsamer macht. Statt alle n² Einträge zu berechnen, priorisiert BALANS Zeilen mit geringer Nachbarschaftsbedeckung und speichert nur die stärksten Verbindungen. Diese Strategie ist nicht nur rechnerisch effizient – sie ist nahezu linear in der Stichprobengröße – sondern liefert auch eine theoretisch garantierte Approximation der vollständigen Matrix.

Tests an vielfältigen realen Cell‑Painting‑Datensätzen sowie an synthetischen Benchmarks zeigen, dass BALANS sowohl die Laufzeit drastisch reduziert als auch die Qualität der Batch‑Korrektur verbessert. Damit bietet die Methode ein robustes Werkzeug für die Analyse großer Morphologie‑Datensätze in der Wirkstoffforschung.

Ähnliche Artikel