KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Jailbreak‑Prompts”

LLM‑Sicherheit: Aktivierungsentanglement erkennt versteckte Jailbreaks

Moderne Sprachmodelle bleiben anfällig für raffinierte Jailbreak‑Prompts, die flüssig und semantisch kohärent formuliert sind. Besonders pr…

arXiv – cs.AI 24.02.2026 05:00

Dual-Cycle Adversarial Self-Evolution: Sicherheit für Rollen-LLMs

Die Fähigkeit von großen Sprachmodellen, in Rollen zu schlüpfen, hat in den letzten Jahren enorme Fortschritte gemacht. Gleichzeitig steigt…

arXiv – cs.AI 17.02.2026 05:00

JailExpert: Mit Erfahrung zum 17 % höheren Erfolg bei LLM‑Jailbreaks

Moderne Sprachmodelle erzeugen zwar größtenteils sicherheitskonformes Material, doch mit sogenannten „Jailbreak‑Prompts“ lassen sich diese…

arXiv – cs.AI 28.08.2025 05:00