MulVul: KI-Mehragenten-Ansatz entdeckt Code-Schwachstellen schneller
In der Welt der Softwareentwicklung stellen Schwachstellen in Codebasis ein enormes Risiko dar. Ein neues Forschungsprojekt namens MulVul präsentiert einen innovativen Ansatz, um diese Gefahren mithilfe von Künstlicher Intelligenz effektiver zu erkennen. Durch die Kombination mehrerer spezialisierter Agenten und einer cleveren Retrieval-Strategie gelingt es MulVul, die Vielfalt der Schwachstellenmuster zu überwinden, die bisher ein einzelnes Modell erschwert haben.
Der Kern von MulVul ist ein zweistufiges System. Zunächst bewertet ein „Router“-Agent die Eingabe und weist die wichtigsten groben Kategorien zu. Anschließend leitet er die Aufgabe an spezialisierte „Detector“-Agenten weiter, die die exakten Schwachstellentypen identifizieren. Beide Agenten greifen auf externe Wissensdatenbanken zurück, um Belege zu sammeln und so die Gefahr von Halluzinationen zu minimieren.
Ein besonderes Highlight ist die „Cross‑Model Prompt Evolution“. Hierbei generiert ein LLM (Large Language Model) fortlaufend neue Prompt‑Kandidaten, während ein separater LLM deren Wirksamkeit testet. Durch diese Trennung wird das Risiko von Selbstkorrektur‑Bias reduziert und die Qualität der Prompts signifikant gesteigert. In Tests mit 130 verschiedenen CWE‑Typen erreichte MulVul einen beeindruckenden Macro‑F1‑Score von 34,79 % – ein Vorsprung von 41,5 % gegenüber dem besten Vergleichsmodell.
Die Ablationsstudien zeigen, dass die Cross‑Model Prompt Evolution den größten Beitrag leistet: Sie steigert die Leistung um 51,6 % im Vergleich zu manuellen Prompts und bewältigt damit die heterogenen Schwachstellenmuster mit bemerkenswerter Präzision. MulVul demonstriert damit, wie KI‑gestützte Mehragenten-Architekturen die Sicherheit von Softwarelösungen nachhaltig verbessern können.