Forschung
Das Condensate-Theorem: Transformer-Modelle laufen linear, nicht quadratisch
In einer neuen Veröffentlichung auf arXiv (2602.06317v1) wird das Condensate-Theorem vorgestellt, das zeigt, dass die Sparsität der Aufmerk…
arXiv – cs.LG