BarcodeMamba+ revolutioniert die Fungi-Barcode‑Klassifikation

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

DNA‑Barcodes sind das Rückgrat der weltweiten Biodiversitätsüberwachung. Bei Pilzen stoßen jedoch herkömmliche Klassifikationsmethoden an ihre Grenzen, weil die Daten stark lückenhaft sind und die taxonomische Verteilung extrem langschwänzig ist.

Um diese Herausforderungen zu meistern, hat ein internationales Forschungsteam BarcodeMamba+ entwickelt – ein sogenanntes Foundation‑Model, das auf einer leistungsstarken State‑Space‑Model‑Architektur basiert. Durch ein Pre‑train‑und‑Fine‑Tune‑Paradigma nutzt das System teilweise beschriftete Daten und erzielt damit deutlich bessere Ergebnisse als klassische vollständig überwachte Ansätze.

Während des Fine‑Tuning wurden gezielt mehrere Verbesserungen integriert: hierarchisches Label‑Smoothing, ein gewichteter Verlustterm und ein Multi‑Head‑Ausgabe‑Layer, der auf der MycoAI‑Plattform aufbaut. Jede dieser Komponenten trägt signifikant zur Leistungssteigerung bei.

In einem anspruchsvollen Benchmark‑Test, der deutliche taxonomische Verteilungsschwankungen gegenüber dem Trainingsdatensatz simuliert, übertrifft BarcodeMamba+ sämtliche bestehenden Methoden auf allen taxonomischen Ebenen.

Dieses neue Tool bietet Forschern eine robuste, skalierbare Lösung für genomikbasierte Biodiversitätsstudien und etabliert ein effektives Trainingsparadigma für das datenarme Pilz‑Domänenfeld.

Der Quellcode ist öffentlich zugänglich unter https://github.com/bioscan-ml/BarcodeMamba.

Ähnliche Artikel