Naslednja generacija visoko energetsko učinkovitega procesorja AI RZ/V2H za avtonomne robote

31 maja, 2024

469

Renesas Electronics Corporation
Avtor: Shingo Kojima, glavni inženir za ugnezdeno obdelavo, Renesas Electronics
Članek predstavlja MPU RZ/V2H, ki omogoča umetno inteligenco vida in nadzor v realnem času.

Ker se število delovno aktivnega prebivalstva zmanjšuje zaradi upadanja rodnosti in vse večjega deleža starejšega prebivalstva, bo napredna obdelava umetne inteligence, kot so prepoznavanje okolice, odločanje o ukrepih in nadzor gibanja, potrebna v različnih vidikih družbe, vključno s tovarnami, logistiko, zdravstveno oskrbo, servisnimi roboti v mestu in varnostnimi kamerami. Sistemi bodo morali v različnih vrstah programov v realnem času obdelovati podatke z napredno umetno inteligenco (AI).

Slika 1: Funkcije prilagodljivega dinamično rekonfiguriranega procesorja (DRP)

RZ/V2H se lahko odzove na nadaljnji razvoj umetne inteligence in kompleksne zahteve teh aplikacij. Ta članek predstavlja, kako RZ/V2H rešuje izzive, povezane s segrevanjem čipa, omogoča visoko hitrost obdelave v realnem času ter uresničuje večjo zmogljivost in manjšo porabo energije za izdelke, opremljene z umetno inteligenco.

Za izpolnitev teh potreb trga je Renesas razvil DRP-AI3 (dinamično rekonfiguriran procesor za AI3) kot pospeševalnik umetne inteligence za zelo hitro obdelavo rezultatov umetne inteligence, ki združuje nizko porabo energije in prilagodljivost, ki jo zahtevajo naprave na robu. Ta več let gojena tehnologija rekonfigurabilnega procesorskega AI pospeševalnika je vgrajena v serijo MPU-jev RZ/V, namenjenih AI aplikacijam.

RZ/V2H je nov vrhunski izdelek serije RZ/V, ki dosega približno 10-krat višjo energijsko učinkovitost kot prejšnji izdelki. RZ/V2H se lahko odzove na nadaljnji razvoj umetne inteligence in kompleksne zahteve aplikacij, kot so roboti. Ta članek predstavlja, kako RZ/V2H rešuje izzive, povezane s segrevanjem čipa, omogoča visoko hitrost obdelave v realnem času ter uresničuje večjo zmogljivost in manjšo porabo energije za izdelke, opremljene z umetno inteligenco.

Pospeševalnik DRP-AI3, ki učinkovito obdeluje modele umetne inteligence
Kot tipična tehnologija za izboljšanje učinkovitosti obdelave umetne inteligence je na voljo prirezovanje (pruning), ki omogoča izpuščanje izračunov, ki ne vplivajo bistveno na natančnost prepoznavanja. Vendar je običajno, da so izračuni, ki ne vplivajo na natančnost prepoznavanja, naključno prisotni v modelih umetne inteligence. To povzroča razliko med vzporednostjo strojne obdelave in naključnostjo prirezovanja, zaradi česar je obdelava neučinkovita.

Za rešitev tega problema je Renesas optimiziral svoj edinstveni pospeševalnik umetne inteligence na osnovi DRP (DRP-AI) za prirezovanje. Z analizo, kako so značilnosti vzorca prirezovanja in metoda prirezovanja povezane s točnostjo prepoznavanja v tipičnih AI modelih za prepoznavanje slik (modeli CNN), so določili strojno strukturo AI pospeševalnika, ki lahko doseže visoko točnost prepoznavanja in učinkovito stopnjo prirezovanja, ter jo uporabili pri DRP-AI3 zasnovi. Poleg tega je bila razvita programska oprema za zmanjšanje teže modelov umetne inteligence, optimiziranih za ta DRP-AI3. Ta programska oprema pretvori konfiguracijo modela naključnega prirezovanja v zelo učinkovito vzporedno računanje, kar omogoča hitrejšo obdelavo UI. Zlasti Renesasova zelo prilagodljiva podporna tehnologija prirezovanja (prilagodljiva tehnologija prirezovanja N:M), ki lahko dinamično spreminja število ciklov kot odziv na spremembe lokalne stopnje prirezovanja v UI modelih, omogoča natančen nadzor stopnje prirezovanja glede na porabo energije, hitrost delovanja in natančnost prepoznavanja, ki jo zahtevajo uporabniki.

Značilnosti heterogene arhitekture, v kateri DRP-AI3, DRP in procesorji delujejo skupaj:
Večnitna in zaporedna obdelava s pospeševalnikom umetne inteligence (DRP-AI3), DRP in procesorji
Aplikacije za robote z nizkim tresenjem in visoko hitrostjo z DRP (dinamično rekonfigurabilna ožičena logična strojna oprema)

Storitveni roboti na primer potrebujejo napredno obdelavo umetne inteligence za prepoznavanje okolice. Po drugi strani pa je za odločanje in nadzor robotovega obnašanja potrebna tudi obdelava na podlagi algoritmov, ki ne uporablja umetne inteligence. Vendar trenutni ugnezdeni procesorji (CPU) nimajo dovolj virov za izvajanje teh različnih vrst obdelave v realnem času. Podjetje Renesas je to težavo rešilo z razvojem tehnologije heterogene arhitekture, ki omogoča skupno delovanje dinamično rekonfiguriranega procesorja (DRP), pospeševalnika umetne inteligence (DRP-AI3) in centralnega procesorja.

Slika 4: Heterogena arhitektura pospešuje obdelavo prepoznavanja slik (merjeno s testnim čipom)

Kot je prikazano na sliki 1, lahko dinamično rekonfigurabilen procesor (DRP) izvaja aplikacije, medtem ko dinamično preklaplja konfiguracijo povezave vezja aritmetičnih enot na čipu pri vsakem delovnem taktu glede na vsebino, ki jo je treba obdelati. Ker se uporabljajo le potrebna aritmetična vezja, DRP porabi manj energije kot pri obdelavi s procesorjem in lahko doseže večjo hitrost. Poleg tega lahko DRP v primerjavi s procesorji, pri katerih pogosti zunanji dostopi do pomnilnika zaradi izpustov predpomnilnika in drugih vzrokov poslabšajo zmogljivost, vnaprej zgradi potrebne podatkovne poti v strojni opremi, kar povzroči manjše poslabšanje zmogljivosti in manjše nihanje hitrosti delovanja (tresljaje) zaradi dostopov do pomnilnika.

DRP ima tudi funkcijo dinamične rekonfiguracije, ki ob vsaki spremembi algoritma preklopi informacije o povezavi vezja, kar omogoča obdelavo z omejenimi strojnimi viri, tudi v robotskih aplikacijah, ki zahtevajo obdelavo večjega števila algoritmov.

DRP je še posebej učinkovit pri obdelavi pretočnih podatkov, na primer pri prepoznavanju slik, kjer vzporedna in zaporedna obdelava neposredno izboljšata zmogljivost. Po drugi strani pa programi, kot sta odločanje o obnašanju in nadzoru robota, zahtevajo obdelavo ob spreminjanju pogojev in obdelavo podrobnosti kot odziv na spremembe v okolici. Za to je lahko primernejša programska obdelava s procesorjem kot strojna obdelava, kot je na primer v DRP. Pomembno je, da se obdelava razporedi na prava mesta in da deluje usklajeno. Renesasova tehnologija heterogene arhitekture omogoča, da DRP in CPU delujeta skupaj.

Pregled MPU arhitekture in pospeševalnika umetne inteligence (DRP-AI3) je prikazan na sliki 2. Robotske aplikacije uporabljajo prefinjeno kombinacijo prepoznavanja slik na podlagi umetne inteligence ter algoritmov za odločanje in krmiljenje, ki ne temeljijo na umetni inteligenci. Zato bo konfiguracija z DRP za AI obdelavo (DRP-AI3) in DRP za ne-AI algoritme, znatno povečala prepustnost za robotske aplikacije.

Rezultati preverjanja
(1) Preverjanje procesne zmogljivosti modelov umetne inteligence
RZ/V2H, opremljen s to tehnologijo, je dosegel največ 8 TOPS (8 bilijonov operacij vsote produktov na sekundo) za zmogljivost obdelave pospeševalnika umetne inteligence. Poleg tega se lahko pri modelih umetne inteligence, ki so bili prirezani, število operacijskih ciklov zmanjša sorazmerno s količino prirezovanja, s čimer se doseže zmogljivost obdelave modelov umetne inteligence, ki je enaka največ 80 TOPS v primerjavi z modeli pred prirezovanjem. To je približno 80-krat več od zmogljivosti obdelave prejšnjih izdelkov RZ/V, kar pomeni znatno izboljšanje zmogljivosti, ki lahko v zadostni meri sledi hitremu razvoju umetne inteligence (slika 3).

Po eni strani s pospeševanjem obdelave z umetno inteligenco postaja čas obdelave za algoritemsko obdelavo slik brez umetne inteligence, kot sta obdelava pred in po umetni inteligenci, relativno ozko grlo. V procesorjih z umetno inteligenco se del programa za obdelavo slik prenese na DRP, kar prispeva k izboljšanju celotnega časa obdelave sistema. (Slika 4)

Kar zadeva energetsko učinkovitost, je ocena učinkovitosti pospeševalnika umetne inteligence pokazala najvišjo energetsko učinkovitost na svetu (približno 10 TOPS na vat) pri izvajanju glavnih modelov umetne inteligence. (Slika 5)

Pokazali smo tudi, da je mogoče enako obdelavo umetne inteligence v realnem času izvajati na razvojni plošči, opremljeni z RZ/V2H, brez ventilatorja pri temperaturah, primerljivih s konkurenčnimi izdelki, opremljenimi z ventilatorji. (Slika 6)

(2) Primeri aplikacij z uporabo robotov
SLAM (Simultaneously Localization And Mapping), ena od tipičnih robotskih aplikacij, ima na primer zapleteno konfiguracijo, ki zahteva več programskih procesov za prepoznavanje položaja robota vzporedno s prepoznavanjem okolja z obdelavo umetne inteligence. Renesasov DRP robotu omogoča takojšnje preklapljanje programov, vzporedno delovanje z AI pospeševalnikom in procesorjem pa se je izkazalo za približno 17-krat hitrejše od delovanja samo procesorja in za zmanjšanje porabe energije na 1/12 ravni delovanja samo procesorja.

Zaključek
Renesas je razvil RZ/V2H, edinstven procesor umetne inteligence, ki združuje nizko porabo energije in prilagodljivost, ki jo zahtevajo končne točke, z zmogljivostmi obdelave za prirezovanje modelov umetne inteligence ter je 10-krat bolj energetsko učinkovit (10 TOPS/W) kot prejšnji izdelki.

Podjetje Renesas bo pravočasno izdalo izdelke, ki se odzivajo na razvoj umetne inteligence, ki bo po pričakovanjih postajala vse bolj izpopolnjena, in prispevalo k uvajanju sistemov, ki se pametno in v realnem času odzivajo na izdelke na končnih točkah.

Viri:
RZ/V2H: https://www.renesas.com/rzv2h
DRP-AI: Renesasov lastniški pospeševalnik umetne inteligence, ki združuje visoko zmogljivost sklepanja umetne inteligence z nizko porabo energije

https://www.renesas.com

Prejšnji članek

Platformа Tech Master Event

Naslednji članek

Intervju z g. Kurylekom iz podjetja DigiKey

Ime piškotka	Trajanje	Opis
PHPSESSID	dokler ne zaprete brskalnika	Piškotek omogoča shranjevanje sej med posameznimi zahtevami znotraj sistema za upravljanje z vsebinami.
moove_gdpr_popup	1 leto	Shrani uporabnikove preference politike piškotkov

Ime piškotka	Trajanje	Opis
_ga	2 leti	Google Analytics Zabeleži razlikovanje med uporabniki in sejami.
_gid	1 leto	Google Analytics Zabeleži novo sejo ali novega uporabnika.
_gat	10 min	Google Analytics piškotek se uporablja za omejevanje pogostosti zadetkov..
IDE	2 leti	Oglaševalski piškotek podjetja Google Inc. Ki nam omogoča prikazovanje oglasov.

Naslednja generacija visoko energetsko učinkovitega procesorja AI RZ/V2H za avtonomne robote

POVEZANI ČLANKI

01 5491400

stik@svet-el.si

prodaja04@svet-el.si

Najnovejši članki

Priljubljene kategorije