Arm lancerer nye Mali G52, G31 GPU'er, Ny Display og Video IP

I dag lancerer Arm en ny Mali Multimedia Suite af produkter, der består af GPU, displayprocessor og video processor IP'er rettet mod mainstream og low-end. Meddelelsen kommer på et tidspunkt, hvor branchens største vækst kommer fra Kina, hvor "premium" -oplevelsesenheder holder> 30% af den globale smartphone markedsandel. Faktisk har vi set samme fortælling gengivet af MediaTek da det var en kernefaktor i strategibevægelsen og re-fokus på P-serien.

Dækningen starter med meddelelsen af ​​den mellemliggende GPI IP-Mali-G52, der følger G51 annonceret i oktober 2016. G51 var et temmelig mærkeligt GPU-design i den forstand, at vi ikke har set nogen forbruger-soC'er vedtage det, da sælger tilsyneladende har foretrukket at bruge low core count G71 og G72s. Arm siger, at DTV-markedet også er et stort volumenmarked, hvor mainstream-GPU'er er efterspurgte, men vi har mindre synlighed i siliconet på disse markeder.

G52 lover store gevinster som Arm-stillinger op til en 30% forbedring i ydelsestætheden, hvilket betyder fps / mm². Effektiviseringerne er mere konservative med en forbedret 15% forbedring over G51.

Med det, der var overraskende for mig, er at se, at Arm har oplyst, at en af ​​de centrale ændringer i G52 over G51 også er en karakteristik, som jeg forventer at finde i Arms næste generation high-end GPU'er. Den store ændring er fordoblingen af ​​ALU-banerne inden for en kerneforløbsmotor. Som en genopfriskning inkluderede en enkelt ALU-bane til Bifrost-arkitekturen (G71, G72, G51) en FMA og en ADD / SF-enhed. En udførelsesmotor bestod af fire af disse baner og udgør en bølgefront, som i Arms terminologi blev kaldt en quad. G52 er den første til at fordoble banerne fra fire til otte, hvilket effektivt fordobler ALU-gennemstrømningen inden for en eksekutormotor.

Arm siger, at det er her, hvor størstedelen af ​​gevinsterne i ydeevne og tæthed kommer fra, da fordoblingen af ​​ALU-banerne kun øger kerneområdet med ~ 1.22x. 3.6x-stigningen i arbejdsbelastning af maskinlæring skyldes, at de nye ALU'er nu kan håndtere 8-bit dot-produktoperationer.

G52 fortsætter med at bruge G51's "dual pixel" tekstur enheder, der er i stand til at behandle 2 pixels og 2 texels per cyklus. En forvirrende sag for nogle G51-konfigurationer var, at GPU'en bestod af enten kerner med "uni-pixel" -opsætninger eller "dual-pixel" -opsætninger og konfigurationer som MP3, som består af en parring af en uni-pixelkerne med en dobbelt -pixel kerne for at lave en "G51MP3". Og faktisk er der endnu mere forvirring, når vi indser, at tidligere armens MP-betegnelse for GPU'er betød multi-pixel og faktisk tællede mængden af ​​pixel-gennemløb for en GPU. G52 retter nu denne forvirring, og fremtidige MP-betegnelser vil faktisk referere til multi-processor-konfiguration, så en G52MP4 vil betyde, at der er 4 GPU-kerner, mens en G51MP4 officielt beskrev en to-core-konfiguration.

Arm Mali G52 vs G51
Små-G52Små-G51
Kernekonfigurationer1-41-3
ALU baner pr. Kerne (standard)16 (2 EU)
24 (3 EU)
12
Texture Units Per Core21-2
Pixel enheder pr. Kerne21-2
FLOPS: Pixel Ratio16: 1 (2 EU)
24: 1 (3 EU)
12: 1 (Dual-pixel)
24: 1 (Uni-pixel)
API'erOpenGLES 3.2
OpenCL 2.0
Vulkan
OpenGLES 3.2
OpenCL 2.0
Vulkan

For at give kunderne mere valg mellem beregnings- og fyldningsfokuserede konfigurationer, tillader Arm G52'en at blive brugt med kerneopsætninger, der indeholder enten to eller tre udførelsesmotorer, hvilket betyder at FLOPS / kernen kommer ind på enten 32 eller 48, der kun tæller FMA'erne til at 48 eller 72, hvis du tæller i den ekstra ADD / SF-enhed. FLOPS: pixelforholdet ændres naturligvis også, da det er punktet i konfigurationsfleksibiliteten, der kan bruge et 16: 1- eller 24: 1-forhold. Dette forhold er meget mere beregnet afbalanceret i forhold til G51s 12: 1-forhold og er nu det samme som de højere GPU'er.

Mali-400 er Arms mest succesfulde GPU, og man kan nok sige, at det er den mest succesrige GPU nogensinde fra nogen leverandør, da IP'en nu nærmer sig 10 års jubilæum, og det er stadig fragt i nye produkter i dag. Efter at have modtaget generationsopdateringer gennem årene, er det først nu, at vi endelig ser behovet for en ny ultra-low-end GPU som operativsystemer og arbejdsbyrder gør OpenGLES> 3.0 og Vulkan et hårdt krav, noget som den gode gamle Mali400 ikke kan gøre .

Den nye Mali-G31 er beregnet til endelig at erstatte Mali-400 i super lave ende designs. G31 er ikke relateret til G52 i arkitekturen, da den stadig beskæftiger de traditionelle quad-layout (4 ALU baner). Mens G52 hjalp med at fjerne forvirringen i konfigurationen, forbliver G31 forvirrende, når det kommer til enten en one-execution-motor (4-baner) med en 1-pixel pr. Klokteksturenhed eller med to eksekutormotorer (2 × 4 baner) med en 2 pixel pr. klok TMU. I en enkeltkernekonfiguration lover G31 op til en 20% arealreduktion over G51MP2 og op til 12% bedre UI-ydeevne, en metrisk sandsynlighed, der er bundet til kernens fyldningseffektivitet.

Indpakning af dagens annoncering er en opdatering på skærmprocessoren og videoprocessorer.

Mali-V52 er en opfølgning af V61 meddelte også tilbage i slutningen af ​​2016 sammen med G51. V52 skalaer ned V61 og målretter mellemområdet med mere begrænsede funktioner med op til 4K60-kodning og dekodning (i modsætning til 4K120 for V61). Forbedringerne tillod en 2x-dekoderforøgelse, der igen aktiverede et 38% mindre siliciumområde, hvilket er en betydelig figur. Arm siger også, at for HEVC-kodning har den nye arkitektur forbedret sin heuristik og opnår op til en 20% bedre kvalitet ved håndtering af kodekens variable blokstørrelser.

Endelig er Mali-D51 en opfølgning på DP650 og er afledt af den højere ende Mali-D71 hvis arkitektur blev beskrevet under Mali-Cetus kodenavn her hos AnandTech. Den nye IP giver mulighed for en 2x-stigning i arealffektivitet og understøtter op til 8-sammensætningslag meget ligesom D71. Armens displayprocessorer er helt unikke, da de giver mulighed for at downloade UI-gengivelsen helt til displayprocessoren fra GPU'en og dermed opnå en meget god effektivitet i forhold til GPU-only-tilgange.

Oprindelig artikel

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.