EVMbench: KI-Agenten testen Smart‑Contract‑Sicherheit
Ein neues arXiv‑Veröffentlichung (2603.04915v1) präsentiert EVMbench, ein umfassendes Testsystem, das die Fähigkeiten von KI-Agenten bei der Erkennung, Behebung und Ausnutzung von Schwachstellen in Smart Contracts bewertet. Da Smart Contracts auf öffentlichen Blockchains immer mehr Vermögenswerte verwalten, ist die Sicherheit dieser Systeme von entscheidender Bedeutung.
EVMbench stützt sich auf 117 sorgfältig kuratierte Schwachstellen aus 40 Repositorien und nutzt ein lokales Ethereum‑Ausführungsumfeld, um die Agenten anhand von automatisierten Tests und dem aktuellen Blockchain‑Status zu bewerten. Diese realistische Umgebung ermöglicht es, die Leistung der Agenten unter Bedingungen zu messen, die echten Live‑Blockchain‑Instanzen sehr nahekommen.
Die Evaluation umfasst eine Reihe modernster KI-Agenten. Die Ergebnisse zeigen, dass diese Agenten in der Lage sind, Schwachstellen vollständig zu entdecken und auszunutzen – von der Erkennung bis zur Ausführung auf einer aktiven Blockchain. Damit demonstriert EVMbench, dass KI bereits ein mächtiges Werkzeug im Bereich der Smart‑Contract‑Sicherheit sein kann.
Das Team hat den Code, die Aufgaben und das Tooling öffentlich zugänglich gemacht, um weitere Messungen und Entwicklungen in diesem wichtigen Forschungsfeld zu ermöglichen. EVMbench bietet damit eine solide Basis für die kontinuierliche Verbesserung der Sicherheit von Smart Contracts durch KI‑gestützte Ansätze.