GCG-Angriffe auf Diffusions-LLMs: Erste Erkenntnisse zur Robustheit
In einer neuen Studie, die auf arXiv veröffentlicht wurde, wird gezeigt, dass Greedy Coordinate Gradient (GCG)-Angriffe – bislang vor allem bei autoregressiven Modellen erfolgreich – auch bei Diffusions-basierten Sprach…