Forschung
Neue Hierarchische Sparse‑Plus‑Low‑Rank‑Kompression für große Sprachmodelle
Moderne große Sprachmodelle (LLMs) belasten Speicher und Rechenleistung in einem Ausmaß, das eine gezielte Kompression unverzichtbar macht…
arXiv – cs.LG