NVIDIA präsentiert Jet‑Nemotron: 53‑fach schnellere LLMs mit 98 % Kostensenkung
NVIDIA hat die neue Hybrid‑Architektur Jet‑Nemotron vorgestellt, die in den Modellen 2 Billionen und 4 Billionen Parametern bis zu 53,6‑fach höhere Durchsatzraten bei der Textgenerierung erzielt. Trotz der enormen Geschwindigkeitssteigerung bleibt die Genauigkeit gleich oder sogar besser als bei den führenden Full‑Attention‑Modellen.