Neues Quantisierungsverfahren steigert Durchsatz von neuronalen Netzen um 50 %
Ein neues Verfahren namens Arithmetic‑Intensity‑Aware Quantization (AIQ) verspricht, die Leistungsfähigkeit moderner neuronaler Netzwerke deutlich zu erhöhen. Durch die gezielte Auswahl von Bit‑Breiten pro Layer optimie…