NVIDIA Corporation

NVDA

US67066G1040

Semiconduttori

Mercato chiuso - Nasdaq Altri mercati azionari 22:00:00 22/04/2024			Dopo chiusura 01:59:55
795,2 ^USD	+4,35%		793,3	-0,24%

09:22	FPT Corporation darà forma al futuro dell'AI e del cloud su scala globale in collaborazione con NVIDIA	CI
08:00	Le azioni asiatiche estendono i guadagni in vista degli utili tecnologici, yen fragile	RE

Amazon Web Services, Inc. e NVIDIA Corporation collaborano a un'infrastruttura di nuova generazione per l'addestramento di modelli di apprendimento automatico di grandi dimensioni e la creazione di applicazioni di AI generativa

21 marzo 2023 alle 17:16

Amazon Web Services, Inc. (AWS) e NVIDIA Corporation hanno annunciato una collaborazione in più parti incentrata sulla realizzazione dell'infrastruttura di intelligenza artificiale (AI) più scalabile e on-demand del mondo, ottimizzata per l'addestramento di modelli linguistici di grandi dimensioni (LLM) sempre più complessi e per lo sviluppo di applicazioni di AI generativa. Il lavoro congiunto prevede istanze P5 di Amazon Elastic Compute Cloud (Amazon EC2) di nuova generazione alimentate da GPU NVIDIA H100 Tensor Core e dalla rete e scalabilità di AWS, che offriranno fino a 20 exaFLOPS di prestazioni di calcolo per la creazione e l'addestramento di modelli di apprendimento profondo di grandi dimensioni. Le istanze P5 saranno le prime istanze basate su GPU a sfruttare la rete Elastic Fabric Adapter (EFA) di seconda generazione di AWS, che offre 3.200 Gbps di throughput di rete a bassa latenza ed elevata larghezza di banda, consentendo ai clienti di scalare fino a 20.000 GPU H100 in UltraCluster EC2 per accedere on-demand a prestazioni di classe supercomputer per l'AI.

Nuovi cluster di supercomputing Le nuove istanze P5 si basano su oltre un decennio di collaborazione fra AWS e NVIDIA per la realizzazione dell'infrastruttura AI e HPC e si basano su quattro precedenti collaborazioni attraverso le istanze P2, P3, P3dn e P4d(e). Le istanze P5 sono la quinta generazione di offerte AWS alimentate da GPU NVIDIA e arrivano quasi 13 anni dopo la distribuzione iniziale delle GPU NVIDIA, iniziata con le istanze CG1. Le istanze P5 sono ideali per l'addestramento e l'esecuzione dell'inferenza di LLM e modelli di computer vision sempre più complessi, alla base delle applicazioni di AI generativa più esigenti e ad alta intensità di calcolo, fra cui la risposta alle domande, la generazione di codici, la generazione di video e immagini, il riconoscimento vocale e altro ancora.

Costruite specificamente per le aziende e le startup che vogliono portare sul mercato innovazioni alimentate dall'AI in modo scalabile e sicuro, le istanze P5 sono dotate di otto GPU NVIDIA H100 in grado di offrire 16 petaFLOP di prestazioni in precisione mista, 640 GB di memoria ad alta larghezza di banda e connettività di rete a 3.200 Gbps (8 volte di più rispetto alla generazione precedente) in una singola istanza EC2. Le maggiori prestazioni delle istanze P5 accelerano il time-to-train dei modelli di machine learning (ML) fino a 6 volte (riducendo il tempo di addestramento da giorni a ore), e la memoria GPU aggiuntiva aiuta i clienti ad addestrare modelli più grandi e complessi. Si prevede che le istanze P5 riducano il costo di addestramento dei modelli ML fino al 40% rispetto alla generazione precedente, offrendo ai clienti una maggiore efficienza rispetto alle offerte cloud meno flessibili o ai costosi sistemi on-premise. Le istanze Amazon EC2 P5 sono distribuite in cluster hyperscale chiamati EC2 UltraCluster, che comprendono le prestazioni di calcolo, rete e archiviazione più elevate del cloud.

Ogni UltraCluster EC2 è uno dei supercomputer più potenti al mondo, che consente ai clienti di eseguire i carichi di lavoro più complessi di formazione ML multi-nodo e HPC distribuito. Sono dotati di rete non bloccante su scala petabit, alimentata da AWS EFA, un'interfaccia di rete per le istanze Amazon EC2 che consente ai clienti di eseguire applicazioni che richiedono alti livelli di comunicazioni inter-nodo su scala AWS. L'interfaccia hardware di bypass del sistema operativo (OS) personalizzato di EFA e l'integrazione con NVIDIA GPUDirect RDMA migliorano le prestazioni delle comunicazioni inter-istanza riducendo la latenza e aumentando l'utilizzo della larghezza di banda, il che è fondamentale per scalare l'addestramento dei modelli di apprendimento profondo su centinaia di nodi P5.

Con le istanze P5 e EFA, le applicazioni ML possono utilizzare NVIDIA Collective Communications Library (NCCL) per scalare fino a 20.000 GPU H100. Di conseguenza, i clienti ottengono le prestazioni applicative dei cluster HPC in sede con l'elasticità e la flessibilità on-demand di AWS. Oltre a queste capacità di calcolo all'avanguardia, i clienti possono utilizzare il portafoglio di servizi più ampio e profondo del settore, come Amazon S3 per l'archiviazione di oggetti, Amazon FSx per i file system ad alte prestazioni e Amazon SageMaker per la creazione, l'addestramento e la distribuzione di applicazioni di deep learning.

Le istanze P5 saranno disponibili nelle prossime settimane in anteprima limitata. Con le nuove istanze EC2 P5, clienti come Anthropic, Cohere, Hugging Face, Pinterest e Stability AI potranno costruire e addestrare i modelli ML più grandi su scala. La collaborazione attraverso ulteriori generazioni di istanze EC2 aiuterà le startup, le imprese e i ricercatori a scalare senza problemi per soddisfare le loro esigenze di ML.

Nuovi design di server per un'AI scalabile ed efficiente: prima del rilascio di H100, i team di ingegneri di NVIDIA e AWS con competenze nei settori termico, elettrico e meccanico hanno collaborato alla progettazione di server che sfruttano le GPU per offrire AI su scala, con un'attenzione particolare all'efficienza energetica dell'infrastruttura AWS. Le GPU sono in genere 20 volte più efficienti dal punto di vista energetico rispetto alle CPU per alcuni carichi di lavoro AI, con l'H100 fino a 300 volte più efficiente per gli LLM rispetto alle CPU. Il lavoro congiunto ha incluso lo sviluppo di un design termico del sistema, la sicurezza integrata e la gestione del sistema, la sicurezza con l'hypervisor accelerato dall'hardware AWS Nitro e le ottimizzazioni di NVIDIA GPUDirecto per il tessuto di rete AWS custom-EFA.

Sulla base del lavoro di AWS e NVIDIA incentrato sull'ottimizzazione dei server, le aziende hanno iniziato a collaborare sui progetti di server futuri per aumentare l'efficienza di scalabilità con i progetti di sistemi di generazione successiva, le tecnologie di raffreddamento e la scalabilità della rete.

Accedi all'articolo originale.
Avviso legale

Ultime notizie su NVIDIA Corporation

FPT Corporation darà forma al futuro dell'AI e del cloud su scala globale in collaborazione con NVIDIA	09:22	CI
Le azioni asiatiche estendono i guadagni in vista degli utili tecnologici, yen fragile	08:00	RE
La Cina ha acquistato i chip Nvidia recentemente vietati nei server di Super Micro e Dell, come dimostrano le gare d'appalto	05:31	RE
Le azioni asiatiche estendono i guadagni in vista degli utili tecnologici, yen fragile	04:16	RE
UBS CAMBIA OPINIONE SU NVIDIA CORPORATION : non è più Buy	01:06	ZM
I titoli di Wall Street avanzano con i principali risultati aziendali in vista dopo il crollo del mercato	22/04	RE
Le azioni guadagnano, l'oro cala grazie all'attenuarsi dei timori di un conflitto più ampio in Medio Oriente	22/04	RE
Borsa Usa in rialzo dopo sell-off di venerdì, calano tensioni in Medio Oriente	22/04	RE
I venditori allo scoperto intascano un profitto settimanale record dal crollo di Big Tech	22/04	RE
Wall Street guadagna dopo il sell-off di venerdì, le tensioni in Medio Oriente si placano	22/04	RE
STATI UNITI. - I titoli da tenere d'occhio a Wall Street (aggiornamento)	22/04
Borsa Usa, futures in rialzo dopo sell-off venerdì grazie a calo tensioni in Medio Oriente	22/04	RE
Lo slancio degli utili delle Sei grandi aziende tecnologiche 'crollerà' nel 2024, dice UBS	22/04	RE
I futures recuperano dopo il sell-off di venerdì, le tensioni in Medio Oriente si attenuano	22/04	RE
OFFERTA MATTINA AMERICANA - Il Big Tech crolla mentre i Q1 sono in agguato, Nvidia decimata	22/04	RE
Le azioni rimbalzano, il petrolio e l'oro si ritirano per i timori mitigati del Medio Oriente	22/04	RE
Borsa Tokyo : rimbalza dopo il tonfo di venerdi' e chiude a +1%	22/04	DJ
Wall St Week Ahead- Il commercio di megacapsule 'affollato' nelle azioni statunitensi attende il test degli utili	21/04	RE
L'S&P 500, il Nasdaq scendono in mezzo al crollo di Netflix	19/04	MT
Perché Nvidia e i titoli legati all'intelligenza artificiale stanno cedendo	19/04	MT
L'S&P 500, il Nasdaq scendono con il crollo di Netflix	19/04	MT
Il Nasdaq è in ritardo rispetto agli altri indici, con Netflix e i titoli dei chip che trascinano; AmEx solleva il Dow	19/04	RE
Borsa Usa, futures in calo su tensioni in Medio Oriente, scivola Netflix	19/04	RE
Wall St Week Ahead- Il commercio di megacapsule 'affollato' nelle azioni statunitensi attende il test degli utili	19/04	RE
I futures scendono a causa delle tensioni in Medio Oriente, Netflix crolla	19/04	RE

Grafico NVIDIA Corporation

Durata

Periodo

Altri grafici

Profilo Società

NVIDIA Corporation è leader mondiale nella progettazione, nello sviluppo e nella commercializzazione di processori grafici programmabili. Il gruppo sviluppa anche software associati. Le vendite nette sono suddivise per famiglia di prodotti come segue: - soluzioni di elaborazione e di rete (55,9%): piattaforme e infrastrutture di data center, soluzioni di interconnessione Ethernet, soluzioni di elaborazione ad alte prestazioni, piattaforme e soluzioni per veicoli autonomi e intelligenti, soluzioni per infrastrutture di intelligenza artificiale aziendali, processori per il mining di criptovalute, schede di computer embedded per la robotica, l'insegnamento, l'apprendimento e lo sviluppo dell'intelligenza artificiale, ecc; - processori grafici (44,1%): per PC, console di gioco, piattaforme di streaming di videogiochi, workstation, ecc. (marchi GeForce, NVIDIA RTX, Quadro, ecc.). Il gruppo offre anche computer portatili, desktop, computer da gioco, periferiche per computer (monitor, mouse, joystick, telecomandi, ecc.), software per l'elaborazione visiva e virtuale, piattaforme per sistemi di infotainment automobilistici e piattaforme di collaborazione cloud. Le vendite nette sono suddivise per settore tra archiviazione dati (55,6%), giochi (33,6%), visualizzazione professionale (5,7%), automotive (3,4%) e altro (1,7%). Le vendite nette sono distribuite geograficamente come segue: Stati Uniti (30,7%), Taiwan (25,9%), Cina (21,5%) e altro (21,9%).

Settore

Semiconduttori

Calendario

22/05/2024 - Q1 2025 Pubblicazione dei risultati

Indici correlati

S&P 500

Altre informazioni sulla società

Evoluzione del Conto Economico

Altri dati finanziari

Analisi/Opinioni

Perché Nvidia e i titoli legati all'intelligenza artificiale stanno cedendo

19 aprile 2024 alle 22:48

Nvidia offre la migliore esposizione all'intelligenza artificiale, dice Morgan Stanley

10 aprile 2024 alle 18:09

NVIDIA Corporation: la Silicon Valley vuole rompere il monopolio del software CUDA di Nvidia

27 marzo 2024 alle 15:34

Altre analisi

Rating per NVIDIA Corporation

Rating Trading

Rating Investimento

ESG Refinitiv

B-

Altri rating

Consensus Analisti

Vendita

Buy

Raccomandazione media

Buy

Numero di analisti

Ultimo prezzo di chiusura

795,2 USD

Prezzo obiettivo medio

992,5 USD

Differenza / Target Medio

+24,81%

Consenso

Revisioni EPS

Revisioni delle Stime

Utili trimestrali - Indice di sorpresa

Calendario della società

Settore Semiconduttori - Altri

	Variaz. 1 gen.	Capi.
NVIDIA CORPORATION	+60,57%	1.957 Mrd
TAIWAN SEMICONDUCTOR MANUFACTURING COMPANY LIMITED	+25,13%	589 Mrd
BROADCOM INC.	+9,69%	567 Mrd
AMD (ADVANCED MICRO DEVICES)	+0,83%	240 Mrd
QUALCOMM, INC.	+10,75%	179 Mrd
INTEL CORPORATION	-31,52%	146 Mrd
TEXAS INSTRUMENTS	-4,09%	149 Mrd
MICRON TECHNOLOGY, INC.	+27,87%	121 Mrd
ANALOG DEVICES, INC.	-6,17%	92,39 Mrd
ARM HOLDINGS PLC	+23,91%	95,72 Mrd

Semiconduttori - Altri

NVIDIA Corporation

Azioni

NVDA

US67066G1040

Semiconduttori

Amazon Web Services, Inc. e NVIDIA Corporation collaborano a un'infrastruttura di nuova generazione per l'addestramento di modelli di apprendimento automatico di grandi dimensioni e la creazione di applicazioni di AI generativa

Revisioni EPS