LUNA: Lernbare lineare Attention ohne Genauigkeitsverlust
Die neueste Veröffentlichung auf arXiv (2512.08061v1) stellt LUNA vor – eine lernbare, kernelbasierte lineare Attention, die das klassische Problem der quadratischen Softmax‑Kosten umgeht, ohne an Genauigkeit einzubüßen…