XShare: Schnellere MoE-Inferenz durch kollaborative Expertenauswahl
In einer neuen Veröffentlichung auf arXiv (2602.07265v1) stellen die Autoren XShare vor – ein Verfahren, das die Effizienz von Mixture-of-Experts (MoE)-Modellen in der Praxis deutlich steigert. MoE-Architekturen sind mi…