Forschung
UniComp: Bewertung von LLM-Kompression mit Pruning, Quantisierung & Distillation
Die Kompression großer Sprachmodelle (LLMs) wird immer wichtiger, wenn es darum geht, sie in produktiven Systemen einzusetzen. Bisherige St…
arXiv – cs.LG