CodePilot: KI + Monte-Carlo-Suche zur automatischen Fehlerbehebung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In einer wegweisenden Entwicklung kombiniert das neue Framework CodePilot die Kraft von großen Sprachmodellen mit der Monte-Carlo-Baum-Suche (MCTS), um Softwarefehler in realen GitHub-Projekten automatisch zu beheben. Durch die Integration von symbolischer Suche und neuronaler Sprachgenerierung eröffnet CodePilot einen vielversprechenden Ansatz für die automatisierte Softwarewartung.

CodePilot arbeitet hierarchisch: Zunächst lokalisiert es Fehler auf Repository-, Datei- und Funktionsniveau. Anschließend nutzt es MCTS, um vielfältige Patch-Pfade zu erkunden, wobei die Ausführungsergebnisse als Belohnungssignal dienen und die Suche gezielt steuern. Zusätzlich wird eine confidence‑calibrated Generation eingesetzt, um nur bei niedriger Zuversicht weitere Verbesserungen vorzunehmen.

In Tests auf dem SWE‑bench Lite erzielte CodePilot mit offenen Modellen einen beeindruckenden Fehlerbehebungsgrad von 24,67 %. Damit übertrifft es vergleichbare Baselines deutlich und zeigt, dass die Kombination aus symbolischer Suche und KI‑basierten Sprachmodellen ein effektiver Weg ist, um skalierbare, ausführungsgesteuerte Automatisierung im Softwareengineering zu realisieren.

Ähnliche Artikel