SaFeR-CLIP: Sicherheit für Vision‑Language‑Modelle ohne Leistungseinbußen
In der Forschung zu Vision‑Language‑Modellen wie CLIP zeigt sich, dass herkömmliche Sicherheitsanpassungen häufig die allgemeine Leistungsfähigkeit stark beeinträchtigen. Der Grund liegt in starren Ausrichtungsstrategien, die unsichere Konzepte zu fest definierten sicheren Zielen zwingen und damit die semantische Struktur des Modells stören.