Forschung
KnapSpec: Layer-Auswahl als Knapsack-Problem beschleunigt LLMs
Die neue Methode KnapSpec revolutioniert die Inferenz von großen Sprachmodellen, indem sie die Auswahl der zu überspringenden Layer als Kna…
arXiv – cs.LG