Renesas Electronics Corporation ha annunciato lo sviluppo di una tecnologia di processore incorporato che consente di raggiungere velocità più elevate e un consumo energetico inferiore nelle unità di microprocessore (MPU) che realizzano l'IA di visione avanzata. Le nuove tecnologie sviluppate sono le seguenti: (1) un acceleratore AI basato su un processore riconfigurabile dinamicamente (DRP) che elabora in modo efficiente modelli AI leggeri e (2) una tecnologia di architettura eterogenea che consente l'elaborazione in tempo reale attraverso il funzionamento cooperativo di IP di processori, come la CPU. Renesas ha prodotto un prototipo di AI-MPU embedded con queste tecnologie e ne ha confermato il funzionamento ad alta velocità e a basso consumo energetico.

Ha raggiunto un'elaborazione fino a 16 volte più veloce (130 TOPS) rispetto a prima dell'introduzione di queste nuove tecnologie, e un'efficienza energetica di prim'ordine (fino a 23,9 TOPS/W con alimentazione a 0,8 V). Con la recente diffusione dei robot nelle fabbriche, nella logistica, nei servizi medici e nei negozi, cresce l'esigenza di sistemi in grado di funzionare autonomamente in tempo reale, rilevando l'ambiente circostante grazie a un'intelligenza artificiale avanzata. Poiché ci sono forti limitazioni alla generazione di calore, in particolare per i dispositivi embedded, nei chip AI sono richieste sia prestazioni più elevate che consumi ridotti.

Renesas ha sviluppato nuove tecnologie per soddisfare questi requisiti e ha presentato questi risultati il 21 febbraio, in occasione della International Solid-State Circuits Conference 2024 (ISSCC 2024), tenutasi dal 18 al 22 febbraio 2024 a San Francisco. Le tecnologie sviluppate da Renesas sono le seguenti: (1) Un acceleratore AI che elabora in modo efficiente i modelli AI leggeri - Come tecnologia tipica per migliorare l'efficienza dell'elaborazione AI, è disponibile il pruning per omettere i calcoli che non influiscono in modo significativo sulla precisione del riconoscimento. Tuttavia, è comune che i calcoli che non influiscono sull'accuratezza del riconoscimento siano presenti in modo casuale nei modelli di IA.

Ciò causa una differenza tra il parallelismo dell'elaborazione hardware e la casualità del pruning, che rende l'elaborazione inefficiente. Per risolvere questo problema, Renesas ha ottimizzato il suo esclusivo acceleratore AI basato su DRP (DRP-AI) per il pruning. Analizzando il modo in cui le caratteristiche del modello di potatura e un metodo di potatura sono correlati all'accuratezza del riconoscimento nei tipici modelli di AI per il riconoscimento delle immagini (modelli CNN), è stata identificata la struttura hardware di un acceleratore AI in grado di ottenere sia un'elevata accuratezza del riconoscimento che un tasso di potatura efficiente, e l'abbiamo applicata al progetto DRP-AI.

Inoltre, è stato sviluppato un software per ridurre il peso dei modelli AI ottimizzati per questa DRP-AI. Questo software converte la configurazione del modello di potatura casuale in un calcolo parallelo altamente efficiente, con il risultato di un'elaborazione AI a velocità superiore. In particolare, la tecnologia di supporto alla potatura altamente flessibile di Renesas (tecnologia di potatura flessibile N:M), che può cambiare dinamicamente il numero di cicli in risposta alle variazioni del tasso di potatura locale nei modelli AI, consente un controllo fine del tasso di potatura in base al consumo energetico, alla velocità operativa e alla precisione di riconoscimento richiesti dagli utenti.

Questa tecnologia riduce il numero di cicli di elaborazione dei modelli AI ad appena un sedicesimo della potatura dei modelli incompatibili e consuma meno di un ottavo dell'energia. (2) Tecnologia di architettura eterogenea che consente l'elaborazione in tempo reale per il controllo dei robot - Le applicazioni robotiche richiedono un'elaborazione AI di visione avanzata per il riconoscimento dell'ambiente circostante. Nel frattempo, il giudizio e il controllo del movimento del robot richiedono una programmazione dettagliata delle condizioni in risposta ai cambiamenti dell'ambiente circostante, quindi l'elaborazione software basata sulla CPU è più adatta dell'elaborazione basata sull'AI.

La sfida è che le CPU con gli attuali processori embedded non sono pienamente in grado di controllare i robot in tempo reale. Ecco perché Renesas ha introdotto un processore riconfigurabile dinamicamente (DRP), che gestisce un'elaborazione complessa, oltre alla CPU e all'acceleratore AI (DRP-AI). Questo ha portato allo sviluppo della tecnologia dell'architettura eterogenea, che consente velocità più elevate e un consumo energetico inferiore nelle AI-MPU, distribuendo e parallelizzando i processi in modo appropriato.

Un DRP esegue un'applicazione cambiando dinamicamente la configurazione dei collegamenti dei circuiti tra le unità aritmetiche all'interno del chip per ogni clock di operazione, in base ai dettagli di elaborazione. Poiché funzionano solo i circuiti aritmetici necessari, anche per le elaborazioni complesse, è possibile ridurre il consumo energetico e aumentare la velocità. Ad esempio, SLAM (Simultaneous Localization and Mapping), una delle applicazioni tipiche dei robot, è una configurazione complessa che richiede processi di programmazione multipli per il riconoscimento della posizione del robot in parallelo con il riconoscimento dell'ambiente tramite l'elaborazione AI della visione.

Renesas ha dimostrato il funzionamento di questo SLAM attraverso la commutazione istantanea dei programmi con il DRP e il funzionamento in parallelo dell'acceleratore AI e della CPU, ottenendo una velocità di funzionamento circa 17 volte superiore e un'efficienza energetica operativa circa 12 volte superiore rispetto alla sola CPU integrata. Verifica del funzionamento - Renesas ha creato un prototipo di chip di prova con queste tecnologie e ha confermato che ha raggiunto la classe mondiale, l'efficienza energetica di 23,9 TOPS per watt a una tensione di alimentazione normale di 0,8 V per l'acceleratore AI e l'efficienza energetica operativa di 10 TOPS per watt per i principali modelli AI. Ha anche dimostrato che l'elaborazione AI è possibile senza ventola o dissipatore di calore.

L'utilizzo di questi risultati aiuta a risolvere la generazione di calore dovuta all'aumento del consumo di energia, che è stata una delle sfide associate all'implementazione dei chip AI in una varietà di dispositivi embedded, come i robot di servizio e i veicoli a guida automatica. La riduzione significativa della generazione di calore contribuirà alla diffusione dell'automazione in vari settori, come quello della robotica e delle tecnologie intelligenti. Queste tecnologie saranno applicate alle MPU Renesas?

MPU della serie RZ/V per le applicazioni AI di visione.