Forschung
CuTeGen: LLM-Framework zur automatischen Optimierung leistungsstarker GPU-Kernel
GPU‑Kernels bilden das Herz moderner Machine‑Learning‑Systeme, doch ihre effiziente Umsetzung bleibt ein komplexer, expertenintensiver Proz…
arXiv – cs.LG