MapPFN: In-Context-Lernen für Genexpressionsvorhersagen in neuen Kontexten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Eine neue Methode namens MapPFN ermöglicht es, die Auswirkungen von gezielten Gen-Interventionen in biologischen Systemen vorherzusagen, ohne dass dafür umfangreiche Trainingsdaten aus jedem möglichen Kontext nötig sind. Das Netzwerk wurde mit synthetischen Daten trainiert, die aus einer prioren Verteilung über kausale Perturbationen generiert wurden, und nutzt anschließend In‑Context‑Learning, um nach einer Intervention die Verteilung der Genexpression zu schätzen – und das ohne Gradient‑Optimierung.

MapPFN kann sich an bislang unbekannte biologische Kontexte anpassen, indem es neue interventional evidence während der Inferenz nutzt. Obwohl das Modell ausschließlich auf in silico‑Knockout‑Daten vortrainiert wurde, identifiziert es differenziell exprimierte Gene mit einer Genauigkeit, die mit Modellen vergleichbar ist, die auf echten Single‑Cell‑Daten trainiert wurden.

Die Autoren stellen den Code und die Daten auf GitHub zur Verfügung (https://github.com/marvinsxtr/MapPFN) und veröffentlichen die Arbeit unter arXiv:2601.21092v1. Diese Entwicklung könnte die Planung von Interventionen in der Biologie erheblich beschleunigen und die Forschung in Bereichen wie Genom‑Editierung und personalisierter Medizin voranbringen.

Ähnliche Artikel