L-MoE: End-to-End Training of a Lightweight Mixture of Low-Rank Adaptation Experts
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
Sparsity and Superposition in Mixture of Experts
arXiv – cs.AI
•
MultiPL-MoE: Sprachübergreifende Programmierung mit hybriden Experten für LLMs
MarkTechPost
•
Microsoft Releases POML (Prompt Orchestration Markup Language): Bringing Modularity and Scalability to LLM Prompts
arXiv – cs.LG
•
Mehr Vielfalt, weniger Redundanz: Multi-Expert Sparse Autoencoder für LLMs
arXiv – cs.AI
•
SofT-GRPO: Soft-Thinking-LLMs übertreffen klassische Token-basierte RL-Methoden
arXiv – cs.LG
•
Leak@$k$: Unlearning lässt LLMs unter probabilistischer Decodierung nicht vergessen