Forschung
UniQL: Quantisierung & Low‑Rank‑Kompression für Edge‑LLMs
Das Betreiben großer Sprachmodelle auf mobilen Geräten ist wegen begrenzter Speicher‑ und Rechenressourcen besonders schwierig. Die verfügb…
arXiv – cs.LG