KI-Agenten schlagen Penetrationstester: ARTEMIS erreicht 9/8.000 Hosts
In einer wegweisenden Studie wurden zehn erfahrene Cybersicherheitsprofis gegen sechs bestehende KI-Agenten sowie den neu entwickelten Rahmen ARTEMIS auf einem großen Universitätsnetzwerk mit rund 8.000 Hosts und 12 Subnetzen getestet. ARTEMIS belegte dabei den zweiten Platz insgesamt und fand neun valide Schwachstellen mit einer Erfolgsquote von 82 % bei den Einreichungen.
Der neue Agenten-Frameworks zeichnet sich durch dynamische Prompt-Generierung, flexible Unteragenten und automatisches Schwachstellen-Triage aus. Während etablierte Modelle wie Codex und CyAgent hinter den meisten menschlichen Teilnehmern zurückblieben, erreichte ARTEMIS eine technische Raffinesse und Einreichungsqualität, die mit den stärksten menschlichen Prüfern vergleichbar war.
KI-Agenten bieten dabei deutliche Vorteile: Sie führen systematische Aufzählungen durch, nutzen Parallelisierung für Exploits und sind kosteneffizient – ein ARTEMIS-Variante kostet lediglich 18 USD pro Stunde im Vergleich zu 60 USD für professionelle Penetrationstester. Dennoch zeigen die Ergebnisse, dass KI-Agenten höhere Fehlalarme produzieren und bei grafisch basierten Aufgaben noch Schwächen aufweisen.