Forschung
Spectra: Optimierer für LLMs neu gedacht – Anisotrope Spektren im Fokus
In der Ausbildung großer Sprachmodelle (LLMs) zeigen Gradientensignale eine starke Anisotropie: die wiederkehrende sprachliche Struktur kon…
arXiv – cs.LG