Safe2Harm: semantische Isomorphie als neuer Jailbreak für LLMs
In einer kürzlich veröffentlichten Studie auf arXiv wird eine innovative Angriffsmethode gegen große Sprachmodelle (LLMs) vorgestellt, die die Sicherheit dieser Systeme auf ein neues Level hebt. Während bisherige Jailbr…