JEDEC offentliggør HBM2-specifikationen, da Samsung begynder masseproduktion af chips

HBM-teknologien (High-Bandwidth Memory) løser to vigtige problemer i forbindelse med moderne DRAM: det øger væsentligt båndbredden til computerenheder (f.eks. GPU'er) og reducerer strømforbruget. Den første generation af HBM har en række begrænsninger, når det gælder kapacitet og klokkefrekvenser. Imidlertid lover andengenet HBM at fjerne dem.

JEDEC, en stor halvlederteknisk handelsorganisation, der fastsætter standarder for DRAM, har for nylig offentliggjort de endelige specifikationer for anden generation HBM (HBM2), hvilket betyder, at medlemmer af organisationen havde ratificeret standarden. Den nye hukommelsesteknologi bygger på grundlaget for den oprindelige JESD235-standard, der beskriver stablede hukommelsesenheder, der er indbyrdes forbundne ved hjælp af siliciumvias (TSV'er), med en meget bred input / output (I / O) -interface, der fungerer ved moderate datahastigheder. JESD235A hjælper ingeniører med at forbedre ydeevnen, kapaciteten og kapaciteten af ​​HBM-hukommelseschips yderligere. HBM Gen 2 vil være særlig nyttig til de kommende videokort af AMD og NVIDIA, som takket være HBM2 kan rumme så meget som 512 GB / s - 1 TB / s af hukommelsesbåndbredde og 8, 16 eller endda 32 GB hukommelse ombord.

HBM Gen 1: Godt, men med begrænsninger

Den oprindelige JESD235-standard definerer første generation HBM (HBM1) hukommelseschips med en 1024-bit grænseflade og op til 1 Gb / s datahastighed, som stabler to, fire eller otte DRAM-enheder med to 128-bit kanaler pr. Enhed på en base logik dør. Hver HBM-stack (som også kaldes KGSD - kendt god stablet die) understøtter op til otte 128-bit kanaler, fordi den fysiske grænseflade er begrænset til 1024 bits. Hver kanal er i det væsentlige en 128-bit DDR-grænseflade med 2n prefetch-arkitektur (256-bits pr. Hukommelseslæsnings- og skriveadgang), der har sine egne DRAM-banker (8- eller 16-banker afhængigt af densitet), kommando- og datainterface, timings osv. Hver kanal kan arbejde uafhængigt af andre kanaler i stakken eller endda inden for en DRAM-dør. HBM-stabler bruger passive siliciuminterposers til at forbinde til værtsprocessorer (f.eks. GPU'er). For mere information om HBM, se vores artikel kaldet "AMD dykker dybt på høj båndbredde hukommelse - hvad vil HBM bringe AMD?".

HBM gen 1-hukommelse KGSD'er produceret af SK Hynix (det eneste firma, der gør dem kommercielt) stabler fire 2 Gb-hukommelsesdyser og opererer ved 1 Gb / s datahastighed pr. Pin. AMD bruger disse KGSD'er med 1 GB kapacitet og 128 GB / s peak båndbredde pr. Stak til at opbygge sine Fiji GPU system-in-packages (SiPs) og Radeon R9 Fury / R9 Nano videokort. Grafikkortene har 4 GB VRAM ombord, ikke meget for 2016. Mens AMDs flagskibs-videokort ikke synes at have kapacitetsproblemer lige nu, er 4 GB hukommelse pr. Grafikkort en begrænsning. AMDs nyeste grafikkort sport 512 GB / s af hukommelsesbåndbredde, en massiv mængde ifølge nutidens standarder, men selv den mængde kan være en begrænsning for fremtidige avancerede GPU'er.

HBM Gen 2: God ting bliver bedre

Den anden generation HBM (HBM2) teknologi, som er skitseret af JESD235A-standarden, arver fysisk 128-bit DDR-grænseflade med 2n prefetch-arkitektur, intern organisation, 1024-bit input / output, 1.2 VI / O og kernespændinger samt alle de afgørende dele af den oprindelige teknologi. Ligesom forgængeren understøtter HBM2 to, fire eller otte DRAM-enheder på en base logik dør (2Hi, 4Hi, 8Hi stabler) pr. KGSD. HBM Gen 2 udvider DRAM-enhedernes kapacitet inden for en stak til 8 Gb og øger understøttede datahastigheder op til 1.6 Gb / s eller endda til 2 Gb / s per pin. Derudover giver den nye teknologi en vigtig forbedring for at maksimere den faktiske båndbredde.

En af de vigtigste forbedringer af HBM2 er dens Pseudo Channel-tilstand, som deler en kanal i to individuelle underkanaler af 64 bit I / O hver, hvilket giver 128-bit prefetch pr. Hukommelseslæsnings- og skriveadgang for hver enkelt. Pseudokanaler opererer med samme klokkefrekvens, de deler række og kolonne kommandobuss samt CK og CKE indgange. De har dog adskilt banker, de dekoder og udfører kommandoer individuelt. SK Hynix siger, at Pseudo Channel-tilstanden optimerer hukommelsestilgang og sænker latency, hvilket resulterer i en højere effektiv båndbredde.

Hvis en ASIC-udvikler af en eller anden grund mener, at Pseudo Channel-tilstanden ikke er optimal for deres produkt, kan HBM2-chips også fungere i Legacy-tilstand. Mens hukommelses beslutningstagere forventer, at HBM2 leverer højere effektiv båndbredde end forgængere, afhænger det af udviklere af hukommelsescontrollere, hvor effektive næste generations hukommelsessystemer vil være. Under alle omstændigheder skal vi teste den egentlige hardware, før vi kan bekræfte, at HBM2 er bedre end HBM1 i samme kloksats.

Yderligere forbedringer af HBM2 over HBM1 over HBMXNUMX'en omfatter førstegangsmodus til hård og blød reparation af baner (HBMXNUMX understøtter forskellige DRAM-celletest- og reparationsteknikker for at forbedre udbyttet af stabler, men ikke omlægning af bane), anti-overophedningsbeskyttelse (KGSD can advarselhukommelsescontrollere af usikre temperaturer) og nogle andre.

Anden generations HBM-hukommelse vil blive produceret ved hjælp af nyere fremstillings teknologier end den første-gen HBM. SK Hynix bruger for eksempel sin 29nm-proces til at lave DRAM-dyser til sine HBM1-stabler. For HBM2-hukommelse har virksomheden til hensigt at bruge deres 21nm-proces. Takket være nyere produktionsteknologier og højere effektiv båndbredde skal HBM2 have højere energieffektivitet end HBM1 ved sine datahastigheder, men vi har ikke præcise detaljer på dette tidspunkt. Under alle omstændigheder er HBM2 sandsynligvis mere energieffektiv end GDDR5 og GDDR5X, og derfor er oddsene gode, at det vil være minde om valg til high-end grafikkort i fremtiden.

Samsung Electronics sagde i denne uge, at det var begyndt masseproduktion af HBM2-hukommelse, men afslørede ikke for mange detaljer. Samsungs HBM2 KGSD har 4 GB kapacitet, 2 Gb / s datahastighed pr. Pin og er baseret på fire 8 Gb DRAM dyser. Hukommelseschips vil lade enhedsproducenterne opbygge SiP'er med op til 16 GB hukommelse. Det er bemærkelsesværdigt, at Samsung besluttede at bruge 8 Gb DRAM dyser til sine HBM2 stabler. En sådan beslutning ser ret logisk ud, da 8 Gb DRAM IC'er relativt let kan øge eller formindske kapaciteten af ​​sine KGSD'er ved at ændre antallet af DRAM-lag. DRAM-producenten bruger sin 20nm-proces til at producere sine HBM2 DRAM KGSD'er. Desværre afslørede Samsung ikke det faktiske strømforbrug af de nye hukommelsestabler.

GPU Memory Math
AMD Radeon R9 290XNVIDIA GeForce GTX 980 TiAMD Radeon R9 Fury XSamsungs 4-Stack HBM2 baseret på 8 Gb DRAMsTeoretisk GDDR5X 256-bit subsystem
Samlet kapacitet4 DK6 DK4 DK16 DK8 DK
Båndbredde pr. Pin5 Gb / s7 Gb / s1 Gb / s2 Gb / s10 Gb / s
Antal Chips / Stacks1612448
Båndbredde pr. Chip / stak20 GB / s28 GB / s128 GB / s256 GB / s40 GB / s
Effektiv busbredde512-bit384-bit4096-bit4096-bit256-bit
Samlede båndbredde320 GB / s336 GB / s512 GB / s1 TB / s320 GB / s
Estimeret DRAM
Strømforbrug
30W31.5W14.6Wn / a20W

Større pakke

HBM2 hukommelsestabler er ikke kun hurtigere og mere kapacitive end HBM1 KGSD'er, men de er også større. SK Hynix HBM1-pakke har dimensioner på 5.48 mm × 7.29 mm (39.94 mm2). Virksomhedens HBM2-chip har dimensioner på 7.75 mm × 11.87 mm (91.99 mm2). Desuden vil HBM2 stabler også være højere (0.695 mm / 0.72 mm / 0.745 mm versus 0.49 mm) end HBM1 KGSD'er, hvilket kan kræve, at udviklere af ASIC'er (f.eks. GPU'er) installerer en varmespreder på deres SiP'er for at kompensere for eventuelle forskelle i højde mellem hukommelsesstablerne og GPU-dysen, for at beskytte DRAM'en og for at sikre tilstrækkelig afkøling for hukommelse med høj båndbredde.

Større fodspor af andengenet HBM2 betyder, at de kommende SiP'er med flere hukommelsestabler vil kræve større siliciuminterposer, hvilket betyder, at de vil være lidt dyrere end SiP'er baseret på den første gen HBM. Eftersom geometriske parametre for forskudt mikrobumpemønster af HBM1 og HBM2 er ens, vil kompleksiteten af ​​passive siliciuminterposers forblive de samme for begge typer hukommelse. En god nyhed er, at for at aktivere båndbredde 512 GB / s er der kun brug for to HBM2-stabler, hvilket betyder, at den nye hukommelsesteknologi fra båndbredde pr. Mm2-perspektiv fortsat er meget effektiv.


Et billede af FormFactor og Teradyne fra deres præsentation på Semiconductor Wafer Test Workshop 2015

Da SK Hynix HBM1 KGSD'er er mindre end virksomhedens HBM2-stabler, vil de have en fordel i forhold til den anden generations høje båndbreddehukommelse for små formfaktor-SiP'er. Som følge heraf kan den Sydkorea-baserede DRAM-producent muligvis opretholde produktionen af ​​sine HBM1-chips i nogen tid.

Nye brugssager og industrisupport

Takket være højere kapacitet og datahastigheder vil HBM2-hukommelsestabler være ret fleksible, når det kommer til konfigurationer. For eksempel vil det være muligt at bygge en 2 GB KGSD med 256 GB / s af båndbredde, der kun bruger to 8 Gb-hukommelsesdyser. En sådan hukommelsesstabel kan bruges til grafikadaptere designet til notebooks eller ultra-små personlige computere. Desuden kan den bruges som en ekstern cache til en hybrid mikroprocessor med indbygget grafik (på samme måde som Intel bruger sin eDRAM cache til at øge effektiviteten af ​​sine integrerede grafikprocessorer). Det, der er tilbage at se, er prisen på HBM2-stabler, som leverer 256 GB / s båndbredde. Hvis HBM2 og det nødvendige interposer forbliver så dyre som HBM1, vil det sandsynligvis fortsat kun blive brugt til premium løsninger.

Takket være en række KGSD-konfigurationer, der er udarbejdet af DRAM-producenter, forventer nye typer enheder at begynde at bruge HBM2. Samsung og SK Hynix mener, at ud over grafik og HPC (high performance computing) kort, vil forskellige servere, netværk og andre applikationer udnytte den nye type hukommelse. I september udviklede 2015 mere end 10-virksomheder system-on-chips (herunder ASIC'er, x86-processorer, ASSP'er og FPGA'er) med HBM-support, ifølge SK Hynix.

Den første generation af HBM-hukommelse giver stor båndbredde og energieffektivitet, men den produceres af kun en producent af DRAM og understøttes ikke bredt af udviklere af forskellige ASIC'er. I modsætning hertil vil Samsung Electronics og SK Hynix, to virksomheder, der styrer godt over 50% af den globale DRAM-udgang, lave HBM2. Micron Technology skal dog bekræfte sine planer om at opbygge HBM2, men da dette er en hukommelsestype af industriel standard, er døren åben, hvis virksomheden ønsker at producere den.

Samlet set vokser branchens support til hukommelsesteknologien med høj båndbredde. Der er 10-virksomheder, der arbejder på SoCs med HBM-support, og de førende DRAM-beslutningstagere gearer op for at producere HBM2. Muligheden for andengenet HBM synes at være ret høj, men omkostningerne forbliver en stor bekymring. Uanset hvad det vil være yderst interessant at se næste generationens grafikkort fra AMD og NVIDIA med HBM2 DRAM og find ud af, hvad de er i stand til på grund af de nye Polaris- og Pascal-arkitekturer samt den nye type hukommelse.

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.