Forschung
Interpretierbare Wissensübertragung in Zeitreihen: Temporal Saliency Distillation
Die Kompression von Modellen durch Knowledge Distillation funktioniert, indem ein großes Lehrmodell (Teacher) sein Wissen an ein kleineres…
arXiv – cs.LG