PETRA: Neuer Transformer vorhersagt SARS‑CoV‑2‑Mutationen mit hoher Genauigkeit

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Seit seiner Entstehung hat sich SARS‑CoV‑2 rasch und unvorhersehbar weiterentwickelt, wobei ständig neue Varianten mit Immunabwehr-Resistenzen auftauchen. Diese Entwicklung stellt die öffentliche Gesundheit und die Impfstoffentwicklung weiterhin vor große Herausforderungen.

Um dieser Problematik zu begegnen, präsentiert das Forschungsteam PETRA – einen Pretrained Evolutionary Transformer. Im Gegensatz zu herkömmlichen Modellen, die reine RNA‑Sequenzen nutzen, basiert PETRA auf evolutionären Pfaden aus Phylogenetischen Bäumen. Dadurch werden Sequenzrauschen reduziert und die hierarchische Struktur der Virus‑Evolution effektiv erfasst.

Durch ein gewichtetes Trainingsschema, das geografische und zeitliche Ungleichgewichte in den globalen Sequenzdaten ausgleicht, erzielt PETRA beeindruckende Ergebnisse. Für Nukleotid‑Mutationen erreicht das Modell eine gewichtete Recall@1 von 9,45 % und für Spike‑Aminosäure‑Mutationen 17,10 %, im Vergleich zu 0,49 % bzw. 6,64 % bei den besten Baselines.

Darüber hinaus demonstriert PETRA seine Fähigkeit, Echtzeit‑Mutationsvorhersagen für bedeutende Klade wie 24F(XEC) und 25A(LP.8.1) zu liefern. Der komplette Code ist als Open‑Source auf GitHub verfügbar, sodass Forscher weltweit von dieser innovativen Methode profitieren können.