<span style="font-weight:bold;">SPANER: Multimodale Semantik vereint – neues PEFT-Framework für Cross‑Modal‑Retrieval</span>
In den letzten Monaten haben sich Parameter‑Effiziente Fine‑Tuning‑Methoden (PEFT) für multimodale Modelle rasant weiterentwickelt. Sie ermöglichen beeindruckende Ergebnisse bei Aufgaben wie Few‑Shot‑Retrieval, doch die meisten Ansätze konzentrieren sich ausschließlich auf task‑spezifische Verbesserungen und vernachlässigen dabei die Struktur des multimodalen Einbettungsraums. Dadurch bleiben modalitätsspezifische Repräsentationen oft isoliert, was die Generalisierung über verschiedene Modalitäten hinweg einschränkt.