Forschung
Neue Methode nutzt interne LLM-Informationen für bessere Distillation
Beim Wissenstransfer von großen Sprachmodellen (LLMs) wird häufig angenommen, dass die Ausgabe des Lehrers ein hochwertiges Trainingssignal…
arXiv – cs.AI