Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Attack Detection”

Neues Scoring-Modell erkennt mehrfache Prompt‑Injection‑Angriffe zuverlässig Eine kürzlich veröffentlichte Arbeit auf arXiv präsentiert ein innovatives Verfahren zur Erkennung von Multi‑Turn Prompt‑Injection‑Angriffen gegen große Sprachmodelle. Während bisherige Ansätze die Gefahr einzelner Gesprächsschritte isoliert bewerten, fehlt bislang eine robuste Methode, um die Risikobewertung über mehrere Konversationsturns hinweg zu aggregieren. Die Autoren zeigen, dass die gängige gewichtete Mit

arXiv – cs.AI 16.02.2026 05:00

arXiv – cs.LG 28.01.2026 05:00

arXiv – cs.LG 08.09.2025 05:00

arXiv – cs.LG 15.08.2025 05:00