Laminar Flow Hypothese: Semantische Turbulenz erkennt Jailbreaks in LLMs
Mit der allgegenwärtigen Verbreitung von Large Language Models (LLMs) wächst die Notwendigkeit, diese Systeme vor gezielten „Jailbreak“-Angriffen zu schützen. Traditionelle Verteidigungsmechanismen setzen häufig auf kos…