Quant-Trim: Low-Bit-Deployment auf Edge‑NPU ohne Vendor‑Abhängigkeiten
Quant‑Trim bringt die Low‑Bit‑Quantisierung von Edge‑Acceleratoren auf ein neues Level. Durch einen gezielten Trainingsschritt erzeugt die Methode ein Hardware‑neutrales Modell, das zuverlässig auf unterschiedlichen NPU‑Backends und Präzisionseinstellungen funktioniert – ohne dass Entwickler ihre Modelle neu anpassen oder spezielle Compiler‑Flags setzen müssen.