Long‑FFT‑Convolutions auf FPGAs: Chunking ermöglicht 450 K‑Längen‑Sequenzen
Die wachsende Nachfrage nach langen Kontextverarbeitungen hat neue neuronale Architekturen hervorgebracht, die über die klassischen Transformer hinausgehen. Ein besonders vielversprechendes Modell ist Hyena, das auf kau…