Wright‑Fisher‑Modell vereint diskrete, Gaußsche und simplex Diffusion
Ein neuer Beitrag auf arXiv präsentiert eine einheitliche Theorie, die die drei bislang getrennten Diffusionsansätze – diskrete Diffusion, Gaußsche Diffusion im euklidischen Raum und Diffusion auf dem Simplex – als unterschiedliche Parameter‑Setzungen desselben zugrunde liegenden Prozesses darstellt. Der Schlüssel dazu ist das Wright‑Fisher‑Modell aus der Populationsgenetik.
Die Autoren zeigen, dass sowohl die diskrete als auch die Gaußsche Variante lediglich Grenzfälle des Wright‑Fisher‑Modells sind, wenn die Populationsgröße gegen unendlich strebt. Durch diese Verbindung lassen sich die Likelihood‑Funktionen und Hyperparameter der drei Modelle formal miteinander verknüpfen, wodurch die bisherige numerische Instabilität bei der simplex‑Diffusion behoben wird.
Ein weiterer Meilenstein ist die Möglichkeit, ein einziges Modell zu trainieren, das anschließend in jedem der drei Domänen – diskret, Gaußscher Raum oder Simplex – eingesetzt werden kann. Die Experimente belegen, dass die neu entwickelte Wright‑Fisher‑simpliciale Diffusion nicht nur stabiler, sondern auch leistungsfähiger ist als die herkömmlichen Ansätze.
Diese Arbeit eröffnet Forschern und Praktikern die Chance, die Vorteile aller drei Diffusionsmethoden zu kombinieren, ohne sich zwischen ihnen entscheiden zu müssen. Sie stellt damit einen bedeutenden Fortschritt für die Modellierung von DNA‑Sequenzen, Proteinen und natürlicher Sprache dar.