UltraMemV2 erreicht mit 120 B Parametern die Leistung von 8‑Expert MoE-Modellen
Die neueste Version des Memory‑Layer‑Netzwerks, UltraMemV2, hat mit 120 B Gesamtparametern die gleiche Leistungsfähigkeit wie aktuelle 8‑Expert‑MoE‑Modelle erreicht – und das bei deutlich weniger Speicherzugriffen. Währ…