ASTRIDE: Neue Plattform zur Bedrohungsmodellierung für KI-Agenten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

KI‑Agenten werden zunehmend zu zentralen Bausteinen moderner Softwarearchitekturen. Sie ermöglichen eigenständige Entscheidungen, dynamische Aufgabenverteilung und multimodale Interaktionen über große Sprachmodelle. Gleichzeitig eröffnen sie neue Sicherheitsrisiken, die klassische Bedrohungsmodelle nicht abdecken – von Prompt‑Injection und Kontext‑Poisoning bis hin zu unklarer Agent‑zu‑Agent-Kommunikation.

Mit ASTRIDE wird die etablierte STRIDE‑Methode erweitert: Ein neuer Bedrohungskategorie‑Kern, „A“ für AI‑Agenten‑spezifische Angriffe, deckt neu auftretende Schwachstellen wie Prompt‑Injection, unsichere Tool‑Aufrufe und logische Manipulationen ab. ASTRIDE nutzt ein Ensemble feinabgestimmter Vision‑Language‑Modelle (VLMs) in Kombination mit dem OpenAI‑GPT‑OSS‑Reasoning‑LLM, um komplette Bedrohungsanalysen direkt aus visuellen Architekturdiagrammen – etwa Datenflussdiagrammen – durchzuführen.

Die Plattform orchestriert den gesamten Automatisierungsprozess über LLM‑Agenten, die die Interaktion zwischen VLM‑Konsortium und dem Reasoning‑LLM koordinieren. Evaluierungen zeigen, dass ASTRIDE präzise, skalierbar und erklärbar Bedrohungsmodelle für nächste‑Generation‑Intelligente Systeme liefert. Nach aktuellem Stand ist ASTRIDE das erste Framework, das STRIDE um KI‑spezifische Bedrohungen erweitert und gleichzeitig fortschrittliche VLM‑Technologien integriert.

Ähnliche Artikel