Suche nach Mixture of Experts

Neues Brain-OF-Modell vereint fMRI, EEG und MEG in einem Foundation Model

In einer wegweisenden Veröffentlichung präsentiert das Forschungsteam das Brain-OF-Modell, das erstmals fMRI, EEG und MEG gemeinsam in eine…

arXiv – cs.AI 02.03.2026 05:00

Forschung

Neues Mixture-of-Experts-Modell verbessert Agentic RL durch Phasenorientierung

In der Welt des Reinforcement Learning (RL) haben große Sprachmodelle (LLM) Agenten mit einer beeindruckenden Fähigkeit ausgestattet, kompl…

arXiv – cs.AI 20.02.2026 05:00

Praxis

<h1>MoE-Modelle: Mehr Parameter, aber schneller – Wie funktioniert das?</h1> <p>In der KI-Welt ist es überraschend, dass Mixture-of-Experts‑Modelle (MoE) deutlich mehr Parameter besitzen als klassische Transformer‑Modelle, dabei aber bei der Inferenz oft schneller sind. Der Schlüssel liegt in ihrer sparsamen Nutzung der Parameter.</p> <p>Beide Modelltypen bauen auf derselben Grundarchitektur auf: Selbst‑Aufmerksamkeit gefolgt von Feed‑Forward‑Netzen. Der Unterschied besteht darin, dass MoE mehrere spezialis

MarkTechPost 04.12.2025 05:17

Produkt

Expertenmischung treibt KI-Spitzenmodelle an – 10× schneller auf NVIDIA Blackwell

Die zehn leistungsstärksten Open‑Source‑KI‑Modelle setzen auf eine Expertenmischung (Mixture‑of‑Experts, MoE). Beispiele wie Kimi K2 Thinki…

NVIDIA – Blog 03.12.2025 16:00

Forschung

Ada-MoGE: Adaptive Gaussian Mixture of Experts verbessert Zeitreihenprognosen

Die neue Methode Ada-MoGE (Adaptive Mixture of Gaussian Experts) löst ein langjähriges Problem in der Vorhersage von multivariaten Zeitreih…

arXiv – cs.LG 03.12.2025 05:00

Forschung

ConSurv: Multimodales Lernen verbessert Krebsüberlebensvorhersagen

In der klinischen Praxis ist die Vorhersage von Überlebensraten bei Krebspatienten entscheidend, weil sie die Einschätzung von Sterblichkei…

arXiv – cs.LG 14.11.2025 05:00

Forschung

Bayesian-MoE: Neue Unsicherheitsabschätzung für große Sprachmodelle

Ein neues Verfahren namens Bayesian-MoE liefert für feinabgestimmte große Sprachmodelle (LLMs) eine robuste Unsicherheitsabschätzung, ohne…

arXiv – cs.LG 13.11.2025 05:00

Forschung

Optimale Expertenauswahl: Selective Sinkhorn Routing steigert SMoE-Leistung

Die neue Methode „Selective Sinkhorn Routing“ (SSR) bringt Sparse Mixture-of-Experts (SMoE) auf ein neues Level. Durch die Formulierung der…

arXiv – cs.LG 13.11.2025 05:00

Forschung

MoE-Offloading: Neue Caching‑Strategien und Pre‑Fetching steigern Effizienz

Die Mixture‑of‑Experts‑Architektur (MoE) ist heute ein zentraler Baustein der fortschrittlichsten KI‑Modelle. Durch ihre besondere Struktur…

arXiv – cs.LG 11.11.2025 05:00

Forschung

Anchor‑MoE: Neue Methode liefert optimale probabilistische Regression

Die Vorhersage von Unsicherheiten in Regressionsaufgaben ist in Wissenschaft und Technik von zentraler Bedeutung. Mit dem neuen Ansatz Anch…

arXiv – cs.LG 26.08.2025 05:00

Forschung

S-MoE steigert ASR & ST um 6,35 %: Effizientes Multi-Task Speech‑to‑Text

In der aktuellen Forschung wird das klassische Hard‑Parameter‑Sharing oft als Hemmschuh für die Leistung mehrerer Aufgaben angesehen, da es…

arXiv – cs.AI 15.08.2025 05:00

Finde Modelle, Firmen und Themen

Neues Brain-OF-Modell vereint fMRI, EEG und MEG in einem Foundation Model

Neues Mixture-of-Experts-Modell verbessert Agentic RL durch Phasenorientierung

Expertenmischung treibt KI-Spitzenmodelle an – 10× schneller auf NVIDIA Blackwell

Ada-MoGE: Adaptive Gaussian Mixture of Experts verbessert Zeitreihenprognosen

ConSurv: Multimodales Lernen verbessert Krebsüberlebensvorhersagen

Bayesian-MoE: Neue Unsicherheitsabschätzung für große Sprachmodelle

Optimale Expertenauswahl: Selective Sinkhorn Routing steigert SMoE-Leistung

MoE-Offloading: Neue Caching‑Strategien und Pre‑Fetching steigern Effizienz

Anchor‑MoE: Neue Methode liefert optimale probabilistische Regression

S-MoE steigert ASR & ST um 6,35 %: Effizientes Multi-Task Speech‑to‑Text

🍪 Cookie-Einstellungen

S-MoE steigert ASR & ST um 6,35 %: Effizientes Multi-Task Speech‑to‑Text