Forschung
TinyLoRA: Mit nur 13 Parametern 91 % Genauigkeit auf GSM8K erreichen
In einer neuen Studie wird gezeigt, dass Sprachmodelle mit einer extrem kleinen Anzahl von trainierbaren Parametern lernen können, komplexe…
arXiv – cs.LG