ECCO: Nachweisbasierte Kausalität verbessert Compiler-Optimierung
Compiler‑Auto‑Tuning steht vor einer klassischen Wahl: traditionelle Black‑Box‑Suchmethoden bieten keine semantische Orientierung, während moderne Large‑Language‑Modelle (LLMs) oft nur oberflächliche Muster erkennen und ihre Entscheidungen schwer nachvollziehbar bleiben. Das neue Framework ECCO verbindet interpretierbare Logik mit kombinatorischer Suche, um diese Lücken zu schließen.
Im Kern nutzt ECCO eine Reverse‑Engineering‑Methode, um ein Chain‑of‑Thought‑Datensatz zu erstellen, der statische Code‑Merkmale explizit mit überprüfbaren Leistungsdaten verknüpft. Dadurch lernt das Modell die kausale Logik hinter Optimierungsentscheidungen, anstatt lediglich Muster zu imitieren. Anschließend arbeitet das LLM als Stratege: Es definiert Optimierungsziele, die die Mutationsschritte eines genetischen Algorithmus dynamisch steuern.
In Experimenten mit sieben unterschiedlichen Datensätzen übertraf ECCO den LLVM‑opt‑O3‑Baseline um durchschnittlich 24,44 % in der Zyklusreduktion. Das Ergebnis zeigt, dass evidenzbasierte kausale Erkenntnisse in Kombination mit genetischer Suche die Leistungsfähigkeit von Compiler‑Optimierungen deutlich steigern können.