WISCA: Leichtgewichtiges Gewichtsskalierungsverfahren verbessert LLM-Training
Die neueste Veröffentlichung auf arXiv (2508.16676v1) stellt WISCA vor – ein schlankes Verfahren zur Gewichtsskalierung, das die Trainingsleistung großer Sprachmodelle (LLMs) ohne Änderungen an der Netzwerkarchitektur s…