Forschung
SSM-Modelle schrumpfen im Training: Schnellere Optimierung ohne Leistungseinbußen
State‑Space‑Modelle (SSMs) sind darauf ausgelegt, lange Sequenzen effizient zu verarbeiten. Sie kombinieren paralleles Training mit schnell…
arXiv – cs.LG