FLUID: Token‑Distillation stärkt multimodale Klassifikation
In der multimodalen Klassifikation gilt die robuste Integration von Bild‑ und Textdaten als entscheidend, doch herkömmliche Fusionsmethoden sind oft anfällig für Modality‑spezifisches Rauschen. Das neue Verfahren FLUID (Flow‑Latent Unified Integration via Token Distillation) löst dieses Problem, indem es auf Token‑Ebene arbeitet und die Stärken beider Modalitäten gezielt nutzt.