DeepSeek V3.2-Exp Cuts Long-Context Costs with DeepSeek Sparse Attention (DSA) While Maintaining Benchmark Parity
Anzeige
Ähnliche Artikel
VentureBeat – AI
•
DeepSeek präsentiert zwei KI-Modelle, die GPT‑5 und Gemini‑3.0‑Pro Konkurrenz machen
Hugging Face – Blog
•
The Future of the Global Open-Source AI Ecosystem: From DeepSeek to AI+
Hugging Face – Blog
•
Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek
arXiv – cs.LG
•
FlashMoE: SSD-Cache für Mixture-of-Experts auf Edge-Geräten optimiert
Hugging Face – Blog
•
One Year Since the “DeepSeek Moment”
arXiv – cs.LG
•
mHC-lite: Mehr Stabilität ohne 20 Sinkhorn‑Knopp Iterationen