AutoSAGE: CUDA‑Scheduler für Sparse GNN Aggregation optimiert GPU‑Leistung
Die neue Methode AutoSAGE, veröffentlicht auf arXiv, bietet einen Eingabe‑sensiblen CUDA‑Scheduler für Sparse GNN‑Aggregationen wie CSR SpMM und SDDMM. Durch eine leichte Schätzung, die mit Mikro‑Proben direkt auf dem Gerät verfeinert wird, wählt AutoSAGE pro Eingabe die optimale Tiling‑ und Mapping‑Strategie. Ein Sicherheitsmechanismus sorgt dafür, dass bei Bedarf auf die Standard‑Kernels des GPU‑Herstellers zurückgegriffen wird, während ein persistenter Cache deterministische Wiedergaben ermöglicht.