Forschung
Neues CPT‑Filtering: Tokenizer‑basierte Abwehr gegen verschlüsselte Prompts
Ein neues Verfahren namens CPT‑Filtering verspricht, die Schwachstellen großer Sprachmodelle gegen sogenannte Jailbreak‑Angriffe zu schließ…
arXiv – cs.AI