Neue Hierarchische Sparse‑Plus‑Low‑Rank‑Kompression für große Sprachmodelle
Moderne große Sprachmodelle (LLMs) belasten Speicher und Rechenleistung in einem Ausmaß, das eine gezielte Kompression unverzichtbar macht. Mit der neuen Hierarchical Sparse Plus Low‑Rank (HSS)-Methode wird dieses Probl…