Forschung
Temperaturparameter in Knowledge Distillation beleuchtet – klare Auswahlrichtlinien
In der Wissensdistillation wird ein Temperaturparameter eingesetzt, um die in den Gewichten des Lehrmodells verborgene Beziehungsmatrix für…
arXiv – cs.LG