Suche Anmelden

Forschung arXiv – cs.LG

AutoSAGE: CUDA‑Scheduler für Sparse GNN Aggregation optimiert GPU‑Leistung

25.11.2025 05:00 • ≈1 Min. Lesezeit • Originalquelle

#AutoSAGE #Sparse GNN #CUDA Scheduler #CSR SpMM #SDDMM #GPU Kernel #Cache #Python Bindings

Kernaussagen

Das nimmst du aus dem Beitrag mit

Die neue Methode AutoSAGE, veröffentlicht auf arXiv, bietet einen Eingabe‑sensiblen CUDA‑Scheduler für Sparse GNN‑Aggregationen wie CSR SpMM und SDDMM.
Durch eine leichte Schätzung, die mit Mikro‑Proben direkt auf dem Gerät verfeinert wird, wählt AutoSAGE pro Eingabe die optimale Tiling‑ und Mapping‑Strategie.
Ein Sicherheitsmechanismus sorgt dafür, dass bei Bedarf auf die Standard‑Kernels des GPU‑Herstellers zurückgegriffen wird, während ein persistenter Cache deterministisch…

Die neue Methode AutoSAGE, veröffentlicht auf arXiv, bietet einen Eingabe‑sensiblen CUDA‑Scheduler für Sparse GNN‑Aggregationen wie CSR SpMM und SDDMM. Durch eine leichte Schätzung, die mit Mikro‑Proben direkt auf dem Gerät verfeinert wird, wählt AutoSAGE pro Eingabe die optimale Tiling‑ und Mapping‑Strategie. Ein Sicherheitsmechanismus sorgt dafür, dass bei Bedarf auf die Standard‑Kernels des GPU‑Herstellers zurückgegriffen wird, während ein persistenter Cache deterministische Wiedergaben ermöglicht.

AutoSAGE deckt sowohl SpMM als auch SDDMM ab und lässt sich nahtlos in einen CSR‑Attention‑Pipeline (SDDMM → Zeilen‑Softmax → SpMM) integrieren. In realen Benchmarks auf Reddit‑ und OGBN‑Products‑Datensätzen erreicht die Lösung die Leistung der Vendor‑Kernels bei breiten Feature‑Breiten und erzielt zusätzliche Gewinne bei kleineren Breiten. In synthetischen Tests mit hoher Sparsität und Schiefe erzielt AutoSAGE bis zu 4,7‑fach schnellere Kernel‑Leistungen.

Die Autoren stellen den CUDA‑Quellcode, Python‑Bindings, einen reproduzierbaren Test‑Harness sowie wiederholbare Cache‑Logs frei, sodass Entwickler die Technik sofort in ihre Projekte integrieren können.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Was veraendert sich praktisch?

Ist das eher Signal, Produkt oder nur kurzfristiger Hype?

Begriffe zum Einordnen

Kontext ohne Glossar-Suche

AutoSAGE

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Sparse GNN

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

CUDA Scheduler

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

arXiv – cs.LG

Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.

Lernpfad

Wenn du nach dieser Meldung weiterlernen willst

Themen-Hub

AutoSAGE systematisch verfolgen

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Archiv

Weitere Beispiele zu AutoSAGE

Nutze das Archiv, um Muster, Wiederholungen und Trendlinien innerhalb des Themas zu sehen.

Im Themen-Cluster weiter

Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen

Themen-Hub

AutoSAGE

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

0 Signale in 7 Tagen • 1 Artikel im Hub

Hub oeffnen →

Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen

arXiv – cs.LG

DR-CircuitGNN beschleunigt Training heterogener GNNs für IC-Designs auf GPUs

26.08.2025 05:00

arXiv – cs.AI

Semantischer Cache für heterogene LLM-Workloads: Kategorie‑basierte Optimierung

03.11.2025 05:00

arXiv – cs.AI

Sparse GNNs ermöglichen skalierbare RL-gestützte Generalisierte Planung

15.08.2025 05:00

arXiv – cs.LG

FlashMoE: SSD-Cache für Mixture-of-Experts auf Edge-Geräten optimiert

27.01.2026 05:00

PyTorch – Blog

Triton-Optimierter BF16 Grouped GEMM Kernel beschleunigt MoE-Modelle

18.08.2025 17:20

Warum das wichtig ist

Relevant fuer Leserinnen und Leser, die KI nicht nur verfolgen, sondern einordnen wollen: Der Beitrag zeigt, was sich bei AutoSAGE, Sparse GNN konkret verschiebt und welche Folgen das fuer Nutzung, Produkte oder Entscheidungen haben kann. Ausgangspunkt ist die Quelle arXiv – cs.LG.

Quellenklarheit

Quelle: arXiv – cs.LG
Original: Zum Ursprungsbeitrag
Website: arXiv – cs.LG

Themenradar

Themen folgen

AutoSAGE

Sparse GNN

CUDA Scheduler

CSR SpMM

Morning Briefing

Diese Themen im Briefing verfolgen

Wenn dich genau diese Themen wieder interessieren werden, mach daraus einen festen Morgen-Slot statt einzelner Zufallsklicks.

Briefing mit Fokus konfigurieren →

Welche Linse du auf diese Meldung legen solltest

Kontext ohne Glossar-Suche

Wenn du nach dieser Meldung weiterlernen willst

Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen

Aehnliche Entwicklungen zum Weiterlesen

🍪 Cookie-Einstellungen