Forschung
NuMuon: Optimierer mit nuklearem Norm-Constraint steigert Kompression von LLMs
Die rasante Entwicklung großer Sprachmodelle (LLMs) wird zunehmend durch Speicher- und Bereitstellungskosten begrenzt. Um diese Hürden zu ü…
arXiv – cs.LG