Forschung
<p>Neues Scoring-Modell erkennt mehrfache Prompt‑Injection‑Angriffe zuverlässig</p> <p>Eine kürzlich veröffentlichte Arbeit auf arXiv präsentiert ein innovatives Verfahren zur Erkennung von Multi‑Turn Prompt‑Injection‑Angriffen gegen große Sprachmodelle. Während bisherige Ansätze die Gefahr einzelner Gesprächsschritte isoliert bewerten, fehlt bislang eine robuste Methode, um die Risikobewertung über mehrere Konversationsturns hinweg zu aggregieren.</p> <p>Die Autoren zeigen, dass die gängige gewichtete Mit
arXiv – cs.AI