Kausale Analyse enthüllt Schlüsselfaktoren für Jailbreak‑Angriffe und -Abwehr
In einer bahnbrechenden Studie wurde ein neues Framework namens Causal Analyst vorgestellt, das die Mechanismen hinter Jailbreak-Angriffen in großen Sprachmodellen (LLMs) systematisch untersucht. Durch die Kombination v…