GROOVE: Neue Methode verbindet schwach gepaarte multimodale Daten
Die neu veröffentlichte Methode GROOVE setzt neue Maßstäbe im semi‑supervised multimodalen Representation Learning. Sie ist speziell für hochkomplexe Störungsdaten konzipiert, bei denen Proben aus unterschiedlichen Modalitäten nur über gemeinsame Störungslabels, aber nicht über direkte Entsprechungen, miteinander verknüpft sind.
Im Mittelpunkt steht GroupCLIP, ein innovativer gruppenbasierter Kontrastverlust, der die Lücke zwischen CLIP (für gepaarte, kreuzmodal Daten) und SupCon (für ein‑modalen, überwachten Kontrastverlust) schließt. Dadurch wird das bisher ungelöste Problem der Kontrastlernen‑Methoden in schwach gepaarten Szenarien adressiert.
GROOVE kombiniert GroupCLIP mit einem Autoencoder, der in Echtzeit zurückübersetzt. Dieser Ansatz fördert die Entfaltung von repräsentationsübergreifenden Merkmalen, während gleichzeitig die Kohärenz innerhalb einer gemeinsamen latenten Ebene auf Gruppenebene erhalten bleibt.
Ein umfassendes kombinatorisches Evaluierungsframework wurde entwickelt, um Lernalgorithmen systematisch über verschiedene optimale Transport‑Aligner hinweg zu bewerten. Durch gezielte Simulationen, die zwischen gemeinsamen und modalspezifischen Störungswirkungen unterscheiden, lässt sich die Robustheit der Methoden präzise prüfen. Die Benchmark‑Ergebnisse zeigen, dass kein einzelner Alignertyp in allen Szenarien dominiert, während GROOVE in Simulationen und bei zwei realen Single‑Cell‑Genetischen‑Störungsdatensätzen gleichwertig oder besser abschneidet. Ablationsstudien verdeutlichen, dass GroupCLIP der entscheidende Faktor für die Leistungssteigerung ist.