MaxCode: KI-Framework steigert Code-Optimierung um bis zu 20 %

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

MaxCode ist ein neues Reinforcement‑Learning‑Framework, das große Sprachmodelle (LLMs) dazu befähigt, Code automatisch zu optimieren. Durch eine Kombination aus Suchalgorithmen, natürlicher Sprachkritik und einem generativen Reward‑to‑Go‑Modell kann MaxCode bei jedem Durchlauf die Leistung von Code‑Snippet verbessern.

Die Optimierung von Code stellt zwei zentrale Herausforderungen dar: Erstens erfordert das Schreiben hochperformanter Programme, etwa CUDA‑Kernels oder CPU‑Code auf Wettbewerbsniveau, tiefes Fachwissen in Systemarchitektur, Algorithmen und spezifischen Programmiersprachen. Zweitens müssen Leistungsmetriken wie Laufzeit und Geräteauslastung interpretiert werden, was über die reine Richtigkeit des Codes hinausgeht.

MaxCode löst diese Probleme, indem es bei der Ausführung von Code‑Vorschlägen Feedback sammelt und dieses Feedback in diagnostische Erkenntnisse umwandelt. Ein Sprachkritikmodell analysiert die Rohdaten der Ausführung und liefert Hinweise auf Fehler und Engpässe. Gleichzeitig wird ein generatives Modell trainiert, das die erwarteten zukünftigen Belohnungen (Reward‑to‑Go) schätzt und damit die Suche nach besseren Lösungen steuert.

In Tests auf den Benchmarks KernelBench (CUDA) und PIE (C++) konnte MaxCode die Performance signifikant steigern. Im Vergleich zu bestehenden Baselines erzielte das System eine absolute Geschwindigkeitsverbesserung von 20,3 % und eine relative Rangverbesserung von 10,1 %. Diese Ergebnisse zeigen, dass MaxCode ein vielversprechender Ansatz für die automatisierte Code‑Optimierung ist.

Ähnliche Artikel