Neuer U-Test revolutioniert multivariate Analyse von Sequenzdaten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Sequenzdatenstudien werden immer wichtiger für genetische Assoziationsstudien komplexer Krankheiten. Sie stellen traditionelle statistische Methoden vor große Herausforderungen, weil die Daten hochdimensional sind und genetische Varianten selten vorkommen.

Besonders spannend ist die Suche nach genetischen Risikofaktoren, die mehrere Krankheitsphänotypen beeinflussen. Da diese Phänotypen oft unterschiedliche Verteilungen aufweisen, erfüllen die meisten bestehenden Verfahren nicht mehr die nötigen Annahmen.

In der vorliegenden Arbeit wird der Generalized Similarity U Test (GSU) vorgestellt. Der Test basiert auf Ähnlichkeitsmaßen und kann sowohl hochdimensionale Genotypen als auch Phänotypen verarbeiten. Die Autoren haben die theoretischen Eigenschaften des GSU untersucht und effiziente Verfahren zur Berechnung von p‑Werten sowie zur Bestimmung von Stichprobengrößen und Power entwickelt.

Simulationen zeigen, dass GSU gegenüber etablierten Methoden höhere Power und Robustheit gegenüber unterschiedlichen Phänotypverteilungen bietet. In einer praktischen Anwendung auf die Dallas Heart Study konnte GSU vier Gene identifizieren, die gemeinsam mit fünf metabolisch relevanten Phänotypen assoziiert sind.

Ähnliche Artikel