Forschung
AutoQRA: Optimale Quantisierung & LoRA für effizientes LLM‑Fine‑Tuning
In der Welt der großen Sprachmodelle (LLMs) ist die Kombination aus Quantisierung und parameter‑effizientem Feintuning zu einem vielverspre…
arXiv – cs.LG