VeriGrey: Greybox-Ansatz entdeckt 33 % mehr Sicherheitslücken in LLM-Agenten
Ein neues arXiv-Papier präsentiert VeriGrey, einen Greybox-Ansatz zur Untersuchung von LLM-Agenten. Diese Agenten kombinieren große Sprachmodelle mit externen Tools, um eigenständig Entscheidungen zu treffen. Durch die…
- Ein neues arXiv-Papier präsentiert VeriGrey, einen Greybox-Ansatz zur Untersuchung von LLM-Agenten.
- Diese Agenten kombinieren große Sprachmodelle mit externen Tools, um eigenständig Entscheidungen zu treffen.
- Durch die autonome Interaktion entstehen jedoch kritische Sicherheitsrisiken.
Ein neues arXiv-Papier präsentiert VeriGrey, einen Greybox-Ansatz zur Untersuchung von LLM-Agenten. Diese Agenten kombinieren große Sprachmodelle mit externen Tools, um eigenständig Entscheidungen zu treffen. Durch die autonome Interaktion entstehen jedoch kritische Sicherheitsrisiken.
VeriGrey nutzt die Reihenfolge der aufgerufenen Tools als Feedback, um gezielt Tests zu steuern. Dabei werden Prompts mutiert, um gezielte Injektionsangriffe zu erzeugen. Die Mutationen verbinden die eigentliche Aufgabe des Agenten mit einer Injektionsaufgabe, sodass die Injektion ein notwendiger Schritt zur Erfüllung der Agentenfunktion wird.
Im Vergleich zu einem Black‑Box-Baseline zeigte VeriGrey auf dem AgentDojo-Benchmark eine 33 % höhere Trefferquote bei indirekten Prompt‑Injection‑Schwachstellen mit einem GPT‑4.1‑Backend. Zusätzlich wurden reale Fallstudien mit dem beliebten Coding‑Agent Gemini CLI und dem persönlichen Assistenten OpenClaw durchgeführt. In beiden Fällen identifizierte VeriGrey Angriffsszenarien, die von Black‑Box‑Methoden nicht entdeckt wurden.
Der Ansatz demonstriert, dass Greybox‑Testing die Sicherheit von LLM-Agenten signifikant verbessern kann, indem seltene, aber gefährliche Tool‑Aufrufe aufgedeckt werden.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.