Forschung
COMPOT: Trainingfreie Kompression von Transformers mit Procrustes‑Optimierung
In der Praxis wird die Kompression von Transformer‑Modellen häufig mit einer abgeschnittenen Singulärwertzerlegung (SVD) durchgeführt. Dies…
arXiv – cs.LG