Forschung
GlowQ: Gruppenbasierte Low‑Rank‑Korrektur für quantisierte LLMs
Quantisierungsmethoden wie BitsAndBytes, AWQ und GPTQ sind Standardwerkzeuge für die Bereitstellung großer Sprachmodelle, doch sie führen h…
arXiv – cs.LG