Gewichteter U-Statistik-Ansatz verbessert genetische Assoziationsanalysen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Dank der rasanten Fortschritte der Next‑Generation‑Sequencing‑Technologie entstehen enorme Mengen an Sequenzdaten, die ein umfassendes Verständnis der Rolle seltener Varianten bei komplexen Erkrankungen ermöglichen. Gleichzeitig stellen die hohe Dimensionalität und die seltenen Allele große Herausforderungen für die statistische Analyse dar.

Traditionelle Methoden verlieren dabei an Power, weil sie die niedrige Häufigkeit genetischer Varianten und die extremen Datenmengen nicht optimal berücksichtigen. Um diesem Problem zu begegnen, wurde die gewichtete U‑Statistik WU‑SEQ entwickelt. Sie basiert auf einem nicht‑parametrischen U‑Statistik‑Ansatz, macht keine Annahmen über das zugrunde liegende Krankheitsmodell oder die Verteilung der Phänotypen und ist damit für eine Vielzahl von Phänotypen einsetzbar.

Simulationen und eine empirische Analyse zeigen, dass WU‑SEQ bei Verletzung der üblichen Annahmen – etwa bei Phänotypen mit stark schiefen Verteilungen – die gängige Methode SKAT übertrifft. Selbst wenn die Annahmen erfüllt sind, erreicht WU‑SEQ eine vergleichbare Leistungsfähigkeit.

In einer praktischen Anwendung auf Sequenzdaten aus dem Dallas Heart Study konnte WU‑SEQ eine signifikante Assoziation zwischen dem Gen ANGPTL4 und dem sehr niedrigen Lipoprotein‑Cholesterin (VLDL‑Cholesterin) nachweisen, was die Aussagekraft des neuen Ansatzes unterstreicht.

Ähnliche Artikel