Reim ist der Schlüssel: Poesie als effektives Jailbreak-Tool für KI
Poetry hat sich als überraschend wirkungsvolles Werkzeug zum Umgehen der Sicherheitsmechanismen der führenden Sprachmodelle erwiesen. Durch geschicktes Reimsetzen können Angreifer die Eingabeaufforderungen so manipulieren, dass die internen Filter des Modells umgangen werden und unerwünschte Inhalte generiert werden.