MoE auf dem Edge: Wichtigkeitsbasiertes Expert Scheduling senkt Latenz um 48 %
Die neueste Veröffentlichung auf arXiv (2508.18983v1) zeigt, wie die Mixture-of-Experts-Architektur auf consumer‑grade Edge‑Hardware gebracht werden kann, indem Experten dynamisch ausgelagert und durch gleichwertige, be…