NVIDIA ha dato il via alla prossima generazione dell'intelligenza artificiale con il lancio della piattaforma NVIDIA Rubin, composta da sei nuovi chip progettati per offrire un supercomputer IA senza precedenti. NVIDIA Rubin stabilisce un nuovo standard per la creazione, il dispiegamento e la sicurezza dei più grandi e avanzati sistemi di IA al mondo, al costo più basso, accelerando così l'adozione mainstream dell'IA. La piattaforma Rubin utilizza una codesign estremo tra i sei chip –

la CPU NVIDIA Vera, la GPU NVIDIA Rubin, lo Switch NVIDIA NVLink 6, la SuperNIC NVIDIA ConnectX-9, la DPU NVIDIA BlueField-4 e lo Switch Ethernet NVIDIA Spectrum-6 – per ridurre drasticamente i tempi di training e i costi dei token di inferenza. La piattaforma Rubin presenta la soluzione a livello rack NVIDIA Vera Rubin NVL72 e il sistema NVIDIA HGX Rubin NVL8.

La piattaforma Rubin introduce cinque innovazioni, tra cui le ultime generazioni della tecnologia di interconnessione NVIDIA NVLink, il Transformer Engine, il Confidential Computing e il RAS Engine, oltre alla CPU NVIDIA Vera. Queste innovazioni accelereranno l'IA agentica, il ragionamento avanzato e l'inferenza di modelli mixture-of-experts (MoE) su scala massiva, con un costo per token fino a 10 volte inferiore rispetto alla piattaforma NVIDIA Blackwell. Rispetto alla generazione precedente, la piattaforma NVIDIA Rubin allena i modelli MoE con 4 volte meno GPU, accelerando così l'adozione dell'IA.

Tra i principali laboratori di IA, fornitori di servizi cloud, produttori di computer e startup che adotteranno Rubin figurano Amazon Web Services (AWS), Anthropic, Black Forest Labs, Cisco, Cohere, CoreWeave, Cursor, Dell Technologies, Google, Harvey, HPE, Lambda, Lenovo, Meta, Microsoft, Mistral AI, Nebius, Nscale, OpenAI, OpenEvidence, Oracle Cloud Infrastructure (OCI), Perplexity, Runway, Supermicro, Thinking Machines Lab e xAI. Le cinque tecnologie rivoluzionarie della piattaforma Rubin includono la sesta generazione di NVIDIA NVLink, la CPU NVIDIA Vera, la GPU NVIDIA Rubin, la terza generazione di NVIDIA Confidential Computing e la seconda generazione del RAS Engine. NVIDIA Rubin introduce anche la NVIDIA Inference Context Memory Storage Platform, una nuova classe di infrastruttura di storage nativa per l'IA progettata per scalare il contesto di inferenza a livello di gigascala.

Grazie a NVIDIA BlueField-4, la piattaforma consente una condivisione e un riutilizzo efficienti dei dati cache key-value attraverso l'infrastruttura IA, migliorando la reattività e il throughput e permettendo una scalabilità prevedibile ed efficiente dal punto di vista energetico per l'IA agentica. BlueField-4 introduce anche l'Advanced Secure Trusted Resource Architecture, o ASTRA, un'architettura di fiducia a livello di sistema che offre ai costruttori di infrastrutture IA un unico punto di controllo sicuro per il provisioning, l'isolamento e la gestione di ambienti IA su vasta scala senza compromettere le prestazioni. NVIDIA Vera Rubin NVL72 offre un sistema unificato e sicuro che combina 72 GPU NVIDIA Rubin, 36 CPU NVIDIA Vera, NVIDIA NVLink 6, NVIDIA ConnectX-9 SuperNIC e NVIDIA BlueField-4 DPU.

NVIDIA offrirà anche la piattaforma NVIDIA HGX Rubin NVL8, una scheda server che collega otto GPU Rubin tramite NVLink per supportare piattaforme IA generative basate su x86. La piattaforma HGX Rubin NVL8 accelera il training, l'inferenza e il calcolo scientifico per i carichi di lavoro IA e di high-performance computing. NVIDIA DGX SuperPOD è il riferimento per il dispiegamento su larga scala di sistemi basati su Rubin, integrando sistemi NVIDIA DGX Vera Rubin NVL72 o DGX Rubin NVL8 con DPU NVIDIA BlueField-4, SuperNIC NVIDIA ConnectX-9, networking NVIDIA InfiniBand e il software NVIDIA Mission Control. NVIDIA Spectrum-6 Ethernet rappresenta la nuova generazione di Ethernet per il networking IA, progettata per scalare le fabbriche IA basate su Rubin con maggiore efficienza e resilienza, grazie ai circuiti di comunicazione 200G SerDes, agli optics co-packaged e ai tessuti ottimizzati per l'IA.

Basati sull'architettura Spectrum-6, i sistemi switch ottici co-packaged Spectrum-X Ethernet Photonics offrono una affidabilità 10 volte superiore e 5 volte più tempo di uptime per le applicazioni IA, garantendo al contempo una efficienza energetica 5 volte migliore e massimizzando le prestazioni per watt rispetto ai metodi tradizionali. La tecnologia Spectrum-XGS Ethernet, parte della piattaforma Spectrum-X Ethernet, consente a strutture separate da centinaia di chilometri o più di operare come un unico ambiente IA. NVIDIA Rubin è in piena produzione e i prodotti basati su Rubin saranno disponibili dai partner nella seconda metà del 2026.

Tra i primi fornitori cloud ad adottare istanze basate su Vera Rubin nel 2026 ci saranno AWS, Google Cloud, Microsoft e OCI, oltre ai Cloud Partner NVIDIA CoreWeave, Lambda, Nebius e Nscale. Microsoft implementerà sistemi rack-scale NVIDIA Vera Rubin NVL72 come parte dei data center IA di nuova generazione, compresi i futuri siti Fairwater AI superfactory. CoreWeave integrerà sistemi basati su NVIDIA Rubin nella propria piattaforma cloud IA a partire dalla seconda metà del 2026.

Cisco, Dell, HPE, Lenovo e Supermicro prevedono di offrire una vasta gamma di server basati sui prodotti Rubin. I laboratori IA tra cui Anthropic, Black Forest, Cohere, Cursor, Harvey, Meta, Mistral AI, OpenAI, OpenEvidence, Perplexity, Runway, Thinking Machines Lab e xAI puntano sulla piattaforma NVIDIA Rubin per addestrare modelli più grandi e avanzati e offrire sistemi multimodali a lungo contesto con minore latenza e costi rispetto alle precedenti generazioni di GPU. I partner software e storage per l'infrastruttura, come AIC, Canonical, Cloudian, DDN, Dell, HPE, Hitachi Vantara, IBM, NetApp, Nutanix, Pure Storage, Supermicro, SUSE, VAST Data e WEKA, stanno collaborando con NVIDIA per progettare piattaforme di nuova generazione per l'infrastruttura Rubin.

La piattaforma Rubin segna la terza generazione dell'architettura rack-scale di NVIDIA, con oltre 80 partner dell'ecosistema NVIDIA MGX. Red Hat ha annunciato una collaborazione ampliata con NVIDIA per offrire uno stack IA completo ottimizzato per la piattaforma NVIDIA Rubin con il portafoglio cloud ibrido di Red Hat, tra cui Red Hat Enterprise Linux, Red Hat OpenShift e Red Hat AI.