Gated KalmaNet: Effiziente, stabile Sprachmodellierung mit Online Ridge Regression
Lineare Zustandsraummodelle (SSMs) bieten für Attention‑basierte Modelle einen enormen Speicher- und Rechenvorteil, weil sie nur eine komprimierte, „verblasste“ Zusammenfassung der Vergangenheit speichern. Diese Beschrä…