GDDR5X Standard færdiggjort af JEDEC: Ny grafikhukommelse op til 14 Gbps

I Q4 2015, JEDEC (en stor halvlederteknik handelsorganisation, der fastsætter standarder for dynamisk random access memory eller DRAM) færdiggjort GDDR5X specifikationenmed medfølgende hvidbøger. Dette er hukommelsesspecifikationen, som forventes at blive brugt til næste generations grafikkort og andre enheder. Den nye teknologi er udviklet til at forbedre båndbredden tilgængelig for grafikbehandlingsenheder med høj ydeevne, uden at fundamentalt ændre hukommelsesarkitekturen for grafikkort eller hukommelsesteknologi i sig selv, ligesom GDDR-generationerne, selv om disse nye specifikationer muligvis skubber phyiscal-grænserne for teknologien og hardware i sin nuværende form.

GDDR5X SGRAM-standarden (Synkronisk grafisk Random Access Memory) er baseret på GDDR5-teknologien, der blev introduceret i 2007 og først brugt i 2008. GDDR5X-standarden bringer tre vigtige forbedringer til den veletablerede GDDR5: det øger datahastigheder med op til to faktorer, det forbedrer energieffektiviteten i hukommelseshukommelsen, og den definerer nye hukommelseskapacitet for at muliggøre tættere hukommelseskonfigurationer af add-in grafikkort eller andre enheder. Hvad der er meget vigtigt for udviklere af chips og producenter af grafikkort er, at GDDR5X ikke behøver drastiske ændringer i grafikkortdesigner, og det generelle funktionalitetssæt GDDR5 forbliver uændret (og derfor hvorfor det ikke kaldes GDDR6).

Performance forbedringer

I dag kan højindvendte GDDR5-hukommelseschips operere ved 7 Gbps til 8 Gbps datahastigheder. Selv om det er muligt at øge GDDR5-grænsefladen for kommando, adresse og data generelt, er det ifølge Micron Technology, en af ​​de vigtigste designere af GDDR5X, begrænsninger, når det gælder arrayhastighed og kommando- / adresseprotokoller. I et forsøg på at forbedre ydeevnen for GDDR5-hukommelsen måtte ingeniører ændre den interne arkitektur af hukommelseschips betydeligt.

Den vigtigste forbedring af GDDR5X-standarden i forhold til forgængeren er dens helt nye 16n prefetch-arkitektur, der gør det muligt at op til 512 bit (64 Bytes) pr. Array læs eller skrive adgang. Derimod har GDDR5-teknologien 8n prefetch-arkitektur og kan læse eller skrive op til 256 bit (32 Bytes) af data pr. Cyklus. Fordubte præfetch og øgede dataoverførselshastigheder forventes at fordoble effektiv hukommelsesbåndbredde af GDDR5X-subsystemer. Den egentlige ydeevne af grafikkort vil dog ikke kun afhænge af DRAM-arkitektur og frekvenser, men også på hukommelsescontrollere og applikationer. Derfor skal vi teste den egentlige hardware for at finde ud af de faktiske virkelige fordele ved den nye hukommelse.

På samme måde som forgængeren fungerer GDDR5X med to forskellige urtyper - et differentialkommandoklok (CK), hvor adresse- og kommandoindgange henvises, samt et fremskrevet differentieret skriveur (WCK), hvor læsnings- og skrivedata refereres til. WCK kører med en frekvens, der er to gange højere end CK. Dataene kan overføres ved dobbelt datahastighed (DDR) eller quaddatahastighed (QDR) i forhold til differenceskrivningsklokken (WCK), afhængigt af om 8n prefetch eller 16n prefetch-arkitektur og -protokoller anvendes. Såfremt chipsmakere formår at øge CK-klokken til 1.5 GHz, vil datahastigheden i QDR / 16n-tilstand stige til 12 Gbps.

Da GDDR5X-protokollen og grænsefladetræningssekvensen svarer til GDDR5's, bør det være forholdsvis nemt for udviklere af chips at justere deres hukommelsescontrollere til den nye type hukommelse. Men da QDR-tilstanden (som kaldes Ultra High Speed-tilstand i Microns materialer) mandater brugen af ​​PLL'er / DLL'er (Phase Locked Loops, Delay Locked Loops), vil der være visse designændringer på design af high-end-hukommelseschips.

JEDECs GDDR5X SGRAM-meddelelse diskuterer datahastigheder fra 10 til 14 Gbps, men Micron mener, at de i sidste ende kunne øges til 16 Gbps. Det er svært at sige, om kommercielle chips faktisk rammer sådanne datahastigheder, idet der tages højde for, at der er nye typer hukommelse indgående. Selv selv et 256-bit GDDR5X-hukommelses-subsystemer, der kører ved 14 Gbps, kunne give op til 448 GBps med hukommelsesbåndbredde, kun 12.5% lavere sammenlignet med AMDs Radeon R9 Fury X (som bruger førstegenet HBM).

GPU Memory Math
AMD Radeon
R9-290X
NVIDIA GeForce
980 GTX Ti
NVIDIA GeForce
GTX 960
AMD Radeon
R9 Fury X
Samsungs 4-Stack HBM2 baseret på 8 Gb DRAMTeoretisk GDDR5X 256-bit
sub-systemet
Teoretisk GDDR5X 128-bit
sub-systemet
Samlet kapacitet4 DK6 DK2 DK4 DK16 DK8 DK4 DK
B / W pr. Pin5 Gb / s7 Gb / s7 Gb / s1 Gb / s2 Gb / s14 Gb / s14 Gb / s
Chip kapacitet2 Gb4 Gb4 Gb1 DK4 DK1 DK
(8 Gb)
1 DK
(8 Gb)
Nej. Chips / Stacks161244484
B / W pr. Chip / stak20
DK / s
28
DK / s
28
DK / s
128
DK / s
256
DK / s
56
DK / s
56
DK / s
Busbredde512-bit384-bit128-bit4096-bit4096-bit256-bit128-bit
I alt B / W320
DK / s
336
DK / s
112
DK / s
512
DK / s
1
TB / s
448
DK / s
224
DK / s
Estimeret DRAM
Strømforbrug
30 W31.5 W10 W14.6 Wn / a20 W10 W

Kapacitetsforbedringer

Ydeevne var ikke det eneste, som udviklere af GDDR5X skulle adressere. Mange applikationer kræver ikke kun høj ydeevne hukommelse, men en masse højtydende hukommelse. Øget kapacitet på GDDR5X-chips vil gøre det muligt for dem at vedtage bredere sæt enheder ud over grafik / beregningskort, spillekonsoller og netværksudstyr samt andre områder. I starten ville man forvente, at konfigurationerne med høj densitet skulle være lidt konservative på frekvens til at begynde med.

GDDR5-standarden dækkede hukommelseschips med 512 Mb, 1 Gb, 2 Gb, 4 Gb og 8 Gb-kapacitet. GDDR5X-standarden definerer enheder med 4 Gb, 6 Gb, 8 Gb, 12 Gb og 16 Gb kapacitet. Normalt har mainstream DRAM-industrien tendens til at fordoble kapaciteter af hukommelseschips på grund af økonomiske og teknologiske årsager. Men med GDDR5X besluttede branchen at ratificere SGRAM-konfigurationer med temmelig usædvanlige kapaciteter - 6Gb og 12Gb.

Den mobile industri anvender allerede LPDDR-enheder med 3 Gb, 6 Gb og 12 Gb kapaciteter i et forsøg på at maksimere fleksibiliteten af ​​hukommelseskonfigurationer til bærbar elektronik. Som det fremgår, ville virksomheder, der udvikler standarder for grafik DRAM, også gerne udnytte fleksibilitet. En GDDR5X chip med 16 Gb kapacitet lavet ved hjælp af 20 nm eller 16 / 18 nm proces teknologi ville have en ret stor dø størrelse og dermed høj pris. Størrelsen og omkostningerne til en 12 Gb DRAM IC bør imidlertid være betydeligt lavere, og en sådan chip kan med rimelighed angribe bredere markedssegmenter udelukkende på bekostning af omkostningerne.

Ligesom GDDR5 understøtter GDDR5X-standarden fuldt ud clamshell-tilstand, som tillader to 32-bit-hukommelseschips at blive drevet af en 32-bit-hukommelsescontroller ved at dele adresse- og kommandobus mens antallet af DRAM IC's I / O'er reduceres. til 16. En sådan operation har ingen indvirkning på systembåndbredden, men tillader fordobling af mængden af ​​hukommelseskomponenter pr. Kanal. For eksempel bør det være teoretisk muligt at opbygge et grafikkort med 64 GB GDDR5X ved hjælp af en GPU med en 512-bit hukommelsesbuss samt 32 16 Gb GDDR5X hukommelseschips.

Usædvanlige kapaciteter hjælper GDDR5X bedre med at adressere alle markedssegmenter, herunder grafikkort, HPC (high performance computing), spilkonsoller, netværksudstyr og så videre. Det skal imidlertid bemærkes, at GDDR5X har ekstremt potent rival, den anden gen HBM, som giver en række fordele, især i high-end segmentet af grafik og HPC markeder.

Energieffektivitet

Strømforbrug og varmeafledning er to hovedbegrænsende faktorer for beregning af ydeevne i dag. Ved udviklingen af ​​GDDR5X-standarden implementerede industrien en række måder at holde strømforbruget af den nye grafik DRAM i kontrol.

Forsyningsspænding og I / O-spænding af GDDR5X blev reduceret fra 1.5V på dagens high-end GDDR5-hukommelsesenheder til 1.35V. Reduktion af Vdd og Vddq skal bidrage til at reducere strømforbruget af den nye hukommelse med op til 10%, hvilket er vigtigt for højeffektive og mobile enheder, hvor hukommelsen kan tage en betydelig del af det tilgængelige strømbudget.

Reduktionen af ​​forsynings- og I / O-spændinger er ikke det eneste mål at reducere strømforbruget af den nye hukommelse. GDDR5X-standarden gør temperaturfølerstyret opdateringshastighed et obligatorisk træk ved teknologien, hvilket kan bidrage til at optimere strømforbruget i visse scenarier. Derudover er der en række andre funktioner og kommandoer, som f.eks. Per-bank selvopfriskning, dvale selvopdatering, delvis array selvopdatering og andre, der var designet til at formindske energiforbruget i det nye SGRAM.

På grund af lavere spændinger og et sæt nye funktioner, bør strømforbruget af en GDDR5X-chip være lavere sammenlignet med en GDDR5-chip ved de samme kurser. Men hvis vi taler om måldatahastigheder for GDDR5X, skal strømforbruget i den nye hukommelse være ens eller lidt højere end GDDR5, ifølge Micron. Virksomheden siger at GDDR5Xs strømforbrug er 2-2.5W pr. DRAM-komponent og 10-30W pr. Bord. Selv med tilsvarende / lidt højere strømforbrug sammenlignet med GDDR5, er GDDR5X opført som betydeligt mere energieffektivt på grund af sin forbedrede teoretiske ydeevne.
Vi kender ikke specifikationer for næste generations grafikadaptere (til desktops og bærbare computere) fra AMD og NVIDIA, men hvis udviklere af GPU'er og DRAM'er faktisk kan slå 14 Gb / s datahastigheder med GDDR5X-hukommelse, vil de fordoble båndbredden til rådighed for grafikprocessorer vs GDDR5 uden væsentligt stigende strømforbrug. Til sidst kan mere effektive datahastigheder og usædvanlige kapaciteter hos GDDR5X bidrage til faktisk at reducere strømforbruget af visse hukommelsesundersystemer.

Implementering

Mens internt er en GDDR5X-chip anderledes end en GDDR5-en, er overgangen fra branchen til GDDR5X et mindre radikal trin end den kommende overgang til HBM (højbåndsbreddehukommelsen) DRAM. Endvidere var overgangen fra GDDR3 / GDDR4 til GDDR5 år siden betydeligt sværere end overgangen til GDDR5X vil være i de kommende år.

GDDR5X-kompatible hukommelseschips kommer i 190-kuglegittersemballage (sammenlignet med 170-kugleemballage, der anvendes til nuværende GDDR5), og de bliver derfor ikke pin-to-pin-kompatible med eksisterende GDDR5 IC'er eller PCB'er til moderne grafik kort. Men mens GDDR5X vil kræve udvikling af nye printkort og opgraderinger til hukommelsescontrollere, virker alt andet nøjagtigt som i tilfælde af GDDR5: Interfacesignalets træningsfunktioner og sekvenser er de samme, fejldetektering er ens, protokoller har mange ligheder, Selv eksisterende GDDR5 lav- og højhastighedstilstande understøttes for at aktivere almindelige og lavt strømforsyningsprogrammer. BGA-pakker er billige, og de behøver ikke siliciuminterposer eller bruger die-stablingsteknikker, som HBM kræver.

Implementering af GDDR5X bør ikke være for dyrt både fra F & U og produktionsperspektiver; I det mindste er det noget, Micron implicerede for flere måneder siden, da det afslørede de første detaljer om teknologien.

Industrisupport

GDDR5X er en JEDEC standard understøttet af dets medlemmer. JEDECs dokument, der dækker teknologien, indeholder leverandør-id'er til tre store DRAM-producenter: Micron, Samsung og SK Hynix. Identifikation af hukommelsesproducenterne er nødvendig for controllere at differentiere mellem forskellige leverandører og forskellige enheder, og notering af hukommelsesproducenter demonstrerer, at de deltog i udvikling, betragtede funktioner og afstemt på dem på JEDECs møder, hvilket kan vise deres interesse for at støtte teknologien . Desværre er nøjagtige planer for hver af firmaerne vedrørende GDDR5X-produktion ukendt, selv om vi forventer, at GDDR5X-dele passer mellem den nuværende GDDR5-high end og noget, der implementerer HBM, eller for at implementere højere hukommelseskapacitet på lavere end-GPU'er. Micron planlægger at starte masseproduktion af sine GDDR5X-hukommelseschips i midten af ​​2016, så vi kan se de faktiske GDDR5X-baserede hukommelsessystemer på mindre end seks måneder fra nu.

NVIDIA, som for øjeblikket er verdens største leverandør af diskrete grafikprocessorer, sagde, at det som medlem af JEDEC deltager i udviklingen af ​​industristandarder som GDDR5X. AMD er også medlem af JEDEC, og det spiller normalt en central rolle i udviklingen af ​​hukommelsesstandarder. Begge disse virksomheder anvender også komprimeringsalgoritmer for at eliminere stresset på teksturoverførsler mellem GPU'en og hukommelsen, og dermed kan en stigning i båndbredde (som vist af Fiji) plus en stigning i tæthed se fordele i teksturrige eller hukommelsesbundne beregningsscenarier.

Mens specifikke planer for forskellige virksomheder vedrørende GDDR5X er uklare, har teknologien et stort potentiale, hvis tallene er korrekte (det skal være, det er en standard) og har alle chancer for at blive vedtaget af industrien. Hoveddivisionen for GDDR5X, anden generation HBM, kan tilbyde højere båndbredde, lavere strømforbrug og mindre formfaktorer, men på bekostning af design og fremstillingskompleksiteter. Faktisk er det, der fortsat er at se, om HBM og GDDR5X rent faktisk vil konkurrere direkte mod hinanden eller bare blive to komplementære typer hukommelse. Forskellige applikationer har i dag forskellige krav, og et HBM-hukommelsessystem med 1 TBps med båndbredde giver en perfekt følelse for en avanceret grafikkort. Men mainstream-videokort skal fungere perfekt med GDDR5X, og chancerne er, at vi vil se begge i spillet på forskellige markedsfokuspunkter.

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.