Forschung
Blockrotation ist der Schlüssel zur MXFP4-Quantisierung
Große Sprachmodelle (LLMs) haben in den letzten Jahren enorme Fortschritte erzielt, doch ihr stetig wachsender Umfang verursacht prohibitiv…
arXiv – cs.LG