Forschung
MoE auf dem Edge: Wichtigkeitsbasiertes Expert Scheduling senkt Latenz um 48 %
Die neueste Veröffentlichung auf arXiv (2508.18983v1) zeigt, wie die Mixture-of-Experts-Architektur auf consumer‑grade Edge‑Hardware gebrac…
arXiv – cs.AI