Effiziente Blockentfernung bei großen Sprachmodellen: Optimierung mit Ising-Modell
Die Reduktion ressourcenintensiver Sprachmodelle durch das Entfernen ganzer Transformer‑Blöcke klingt zunächst simpel, ist jedoch ein exponentiell schwieriges Kombinationsproblem. In der neuen Studie wird dieses Problem…