NAAMSE: Evolutionäres Framework zur Sicherheitsbewertung von KI-Agenten
KI‑Agenten werden immer häufiger in produktiven Systemen eingesetzt, doch ihre Sicherheitsprüfung bleibt ein Engpass. Traditionelle Methoden wie manuelle Red‑Team‑Tests oder statische Benchmarks können adaptive, mehrstufige Angreifer nicht adäquat simulieren. Mit NAAMSE – einem evolutionären Ansatz zur Sicherheitsbewertung – wird das Problem neu formuliert: die Sicherheit von Agenten wird als feedback‑gestütztes Optimierungsproblem betrachtet.