L'IP di interconnessione di Arteris implementato nel server di inferenza di Neureality per applicazioni di Ai generativa e modelli linguistici di grandi dimensioni
10 ottobre 2023 alle 22:30
Condividi
Arteris, Inc. ha annunciato che NeuReality ha implementato l'IP di interconnessione Arteris FlexNoC come parte del server-on-a-chip di inferenza indirizzabile alla rete NR1, per offrire prestazioni elevate e miglioramenti dirompenti in termini di costi e consumi per il calcolo dell'apprendimento automatico e profondo nei suoi prodotti di inferenza AI. Questa integrazione è architettata in un NoC a 8 gerarchie con una larghezza di banda aggregata di 4,5 TB/sec, che soddisfa i requisiti di bassa latenza per l'esecuzione di applicazioni AI su scala e a costi inferiori. Il server di inferenza di NeuReality si rivolge all'IA generativa, ai modelli linguistici di grandi dimensioni (LLM) e ad altri carichi di lavoro di IA.
L'innovativo server-on-a-chip NR1 di NeuReality è la prima Network Addressable Processing Unit (NAPU), un dispositivo hardware ottimizzato per il flusso di lavoro con unità di elaborazione specializzate, rete nativa e capacità di virtualizzazione. Offre una rete AI-over-fabric nativa, compreso l'offload completo della pipeline AI e funzionalità di hypervisor AI basate su hardware. La capacità di scaricare CPU, GPU e persino acceleratori di apprendimento profondo su più chip NR1 è ciò che rende possibile al server di inferenza di NeuReality di offrire effettivamente prestazioni fino a 10 volte superiori con un consumo energetico inferiore e a una frazione del costo del suo server di inferenza.
Arteris, Inc. è un fornitore di IP di sistema per semiconduttori, compresa l'interconnessione e altre proprietà intellettuali (collettivamente, IP di sistema). La sua tecnologia System IP gestisce le comunicazioni on-chip e le implementazioni di blocchi IP nei semiconduttori system-on-chip (SoC) e nei sistemi di chiplet. L'Azienda fornisce IP di interconnessione per semiconduttori e soluzioni software di automazione dell'integrazione SoC (SIA) per servire i suoi mercati finali di riferimento, tra cui l'automotive, l'informatica aziendale, l'elettronica di consumo, le comunicazioni via cavo e wireless e i segmenti industriali. Il suo portafoglio di prodotti IP per semiconduttori comprende IP NoC non coerenti, con FlexNoC e FlexWay, IP NoC coerenti con la cache, con Ncore e cache di ultimo livello, con CodaCache. La sua suite di tecnologia SIA, composta dai prodotti Magillem e CSRCompiler, copre le funzionalità chiave per l'automazione dell'integrazione SoC e l'accelerazione complessiva dello sviluppo SoC. Il prodotto di connettività Magillem abbrevia e semplifica il processo di integrazione SoC.
L'IP di interconnessione di Arteris implementato nel server di inferenza di Neureality per applicazioni di Ai generativa e modelli linguistici di grandi dimensioni