SwizzlePerf: LLMs optimieren GPU-Kernel dank Hardware‑Bewusstsein
SwizzlePerf nutzt große Sprachmodelle (LLMs), um GPU‑Kernel‑Leistung gezielt zu verbessern. Im Gegensatz zu bisherigen Such‑Methoden, die lediglich die Laufzeit optimieren, berücksichtigt SwizzlePerf die spezifischen Speicherzugriffsmuster, Architekturdetails und Profiling‑Logs des jeweiligen Workloads. Dadurch kann das System softwareseitige Optimierungen erzeugen, die exakt auf die zugrunde liegende Hardware abgestimmt sind.