Nvidia präsentiert Rubin CPX: Revolutionärer Accelerator für KI‑Inferenz
Anzeige
Nvidia hat den Rubin CPX vorgestellt, einen hochoptimierten Accelerator, der speziell für die Pre‑Fill‑Phase von KI‑Modellen konzipiert ist. Der einzelne Chip legt dabei einen starken Fokus auf Rechenleistung (FLOPS) und reduziert die Bedeutung der Speicherbandbreite.
Durch diese Ausrichtung wird der Rubin CPX zu einem echten Wendepunkt für Inferenzanwendungen. Die Leistung des Geräts übertrifft die bisherige Benchmark, die erst im März 2024 mit dem GB200 NVL72 Oberon Rack‑Scale-Formfaktor angekündigt wurde.
Ähnliche Artikel
NVIDIA – Blog
•
OpenAI setzt mit GPT‑5.2 auf NVIDIA: Komplexere KI erfordert neue Infrastruktur
MarkTechPost
•
NVIDIA und Mistral AI beschleunigen Mistral 3 um 10‑fach auf GB200 NVL72 GPUs
NVIDIA – Blog
•
NVIDIA Blackwell Raises Bar in New InferenceMAX Benchmarks, Delivering Unmatched Performance and Efficiency
The Register – Headlines
•
Nvidia präsentiert Rubin CPX: GPU für lange Kontext‑AI ohne teure HBM
NVIDIA – Blog
•
NVIDIA-Software ermöglicht effizientes Management von Rechenzentrumsflotten
The Register – Headlines
•
Nvidia entwickelt neues Inventar-Management: Mehr als nur GPU-Tracking