Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Attack Detection”
Forschung

<p>Neues Scoring-Modell erkennt mehrfache Prompt‑Injection‑Angriffe zuverlässig</p> <p>Eine kürzlich veröffentlichte Arbeit auf arXiv präsentiert ein innovatives Verfahren zur Erkennung von Multi‑Turn Prompt‑Injection‑Angriffen gegen große Sprachmodelle. Während bisherige Ansätze die Gefahr einzelner Gesprächs­schritte isoliert bewerten, fehlt bislang eine robuste Methode, um die Risikobewertung über mehrere Konversationsturns hinweg zu aggregieren.</p> <p>Die Autoren zeigen, dass die gängige gewichtete Mit

arXiv – cs.AI