Quant-Trim: Low-Bit-Deployment auf Edge‑NPU ohne Vendor‑Abhängigkeiten
Quant‑Trim bringt die Low‑Bit‑Quantisierung von Edge‑Acceleratoren auf ein neues Level. Durch einen gezielten Trainingsschritt erzeugt die Methode ein Hardware‑neutrales Modell, das zuverlässig auf unterschiedlichen NPU…