SpecBridge: Brücke zwischen Massenspektrometrie und Molekülrepräsentationen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Die Identifizierung von kleinen Molekülen aus Tandem-Massenspektrometrie (MS/MS) bleibt ein entscheidendes Hindernis, wenn die Spektrallibraries unvollständig sind. Trotz des Potenzials von Deep‑Learning‑Ansätzen stoßen aktuelle Methoden meist an zwei Grenzen: Entweder bauen sie explizite generative Modelle, die Molekülgraphen atomweise konstruieren, oder sie nutzen kontrastive Modelle, die von Grund auf neue multimodale Subräume lernen.

SpecBridge präsentiert einen völlig neuen Ansatz, der die Strukturidentifikation als geometrische Ausrichtungsaufgabe behandelt. Dabei wird ein selbstüberwachter Spektralen‑Encoder (DreaMS) feinjustiert, um direkt in den latenten Raum eines eingefrorenen molekularen Foundation‑Modells (ChemBERTa) zu projizieren. Die anschließende Rückretrieval‑Phase erfolgt über Kosinus‑Ähnlichkeit zu einer festen Bank vorberechneter Molekül‑Embeddings.

In den Benchmark‑Suiten MassSpecGym, Spectraverse und MSnLib erzielt SpecBridge eine Steigerung der Top‑1‑Retrieval‑Genauigkeit um etwa 20 – 25 % im Vergleich zu starken neuronalen Baselines, während die Anzahl der trainierbaren Parameter minimal bleibt. Diese Ergebnisse zeigen, dass die Ausrichtung auf eingefrorene Foundation‑Modelle eine stabile und praktikable Alternative zum Entwurf neuer Architekturen darstellt.

Der komplette Code von SpecBridge ist unter https://github.com/HassounLab/SpecBridge verfügbar.

Ähnliche Artikel