Forschung
Effiziente Blockentfernung bei großen Sprachmodellen: Optimierung mit Ising-Modell
Die Reduktion ressourcenintensiver Sprachmodelle durch das Entfernen ganzer Transformer‑Blöcke klingt zunächst simpel, ist jedoch ein expon…
arXiv – cs.LG