cuPilot: Multi-Agent-Framework beschleunigt CUDA-Kernel-Optimierung um 3,09×
Die Optimierung von CUDA-Kernels bleibt ein komplexes und arbeitsintensives Unterfangen, das tiefgreifendes Wissen über Hardware‑Software‑Co‑Design erfordert. Trotz der jüngsten Fortschritte von großen Sprachmodellen (L…