Neuer Set Transformer berücksichtigt Abundanz für präzise Mikrobiom-Embeddings
Die präzise Repräsentation von Mikrobiom-Proben ist entscheidend für die Nutzung großer Sprachmodelle bei Aufgaben wie Phänotypvorhersage und Umweltklassifikation. Bisher wurden die Embeddings der einzelnen Sequenzen meist einfach gemittelt, wodurch die wichtige Information über die relative Häufigkeit der Taxa vernachlässigt wurde.