SHARe-KAN: Holographische Vektorquantisierung senkt Speicherbedarf drastisch

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Die neueste Veröffentlichung auf arXiv (2512.15742v1) präsentiert SHARe-KAN, ein innovatives Verfahren zur Reduktion des Speicherverbrauchs bei Kolmogorov‑Arnold‑Netzwerken (KANs). Durch die Analyse der Vision‑KANs zeigt die Studie, dass die Basisfunktionen eine holographische Topologie besitzen, bei der Informationen über die Interferenz von Splines verteilt sind. Diese Struktur macht herkömmliche Pruning‑Methoden ineffizient, da bereits bei 10 % Sparsity die mAP von 85,23 % auf 45 % sinkt.

SHARe-KAN nutzt Gain‑Shape‑Bias‑Vector‑Quantisierung, um funktionale Redundanz auszunutzen, ohne die dichte Topologie zu zerstören. In Kombination mit LUTHAM, einem hardware‑sensiblen Compiler mit statischer Speicherplanung, konnte die Laufzeit‑Speichergröße um beeindruckende 88‑Fache reduziert werden – von 1,13 GB auf lediglich 12,91 MB. Trotz dieser drastischen Kompression bleibt die Genauigkeit auf dem Niveau der unkomprimierten Baseline bei PASCAL VOC erhalten.

Profiling-Tests auf der NVIDIA Ampere‑Architektur zeigen, dass über 90 % des Arbeitsvolumens im L2‑Cache verbleiben. Dies beweist, dass die Arbeitslast nicht mehr von den DRAM‑Bandbreitenbeschränkungen der spline‑basierten Architektur abhängt. SHARe-KAN stellt damit einen bedeutenden Fortschritt dar, um KAN‑Modelle in speicherbeschränkten Umgebungen einzusetzen, ohne Leistungseinbußen zu riskieren.