NuMuon: Optimierer mit nuklearem Norm-Constraint steigert Kompression von LLMs
Die rasante Entwicklung großer Sprachmodelle (LLMs) wird zunehmend durch Speicher- und Bereitstellungskosten begrenzt. Um diese Hürden zu überwinden, setzen Entwickler auf Kompressionsverfahren, die vor allem die niedri…