LAPA: Neuer sparsamer Accelerator für Transformer mit Log‑Domain‑Vorhersage
Die neuesten Transformer‑Modelle haben die Verarbeitung natürlicher Sprache und Bilddaten revolutioniert. Doch je nach Eingabesequenz verändern sich die Engpässe im Rechenfluss, was eine dynamische, mehrstufige Sparsity…