Floating-Point-Transformer: Grenzen der Ausdruckskraft entdeckt
Eine neue Arbeit, die auf arXiv veröffentlicht wurde, untersucht die Ausdruckskraft von Transformer‑Modellen, die mit Gleitkomma‑Parametern und Gleitkomma‑Operationen arbeiten. Frühere Theorien gingen davon aus, dass di…