Forschung
Laminar Flow Hypothese: Semantische Turbulenz erkennt Jailbreaks in LLMs
Mit der allgegenwärtigen Verbreitung von Large Language Models (LLMs) wächst die Notwendigkeit, diese Systeme vor gezielten „Jailbreak“-Ang…
arXiv – cs.LG