OPTIMA: One-Shot-Pruning von LLMs mit Quadratischer Programmierung – neue Genauigkeit
Die neue Methode OPTIMA setzt einen Meilenstein im Pruning nach dem Training großer Sprachmodelle. Durch die Kombination von Maskenauswahl und einer Reihe unabhängiger, zeilenweise Quadratischer Programme (QPs) wird die…