Forschung
AdaHOP: Schnell und präzise Low-Precision-Training mit adaptiver Hadamard‑Rotation
In der Welt der großen Sprachmodelle (LLMs) ist das Training in niedriger Präzision ein entscheidender Faktor für Speicher‑ und Rechenleist…
arXiv – cs.LG