NVIDIA annoncerer Quadro GP100 - Big Pascal kommer til arbejdsstationer

Afspilning på denne søndag eftermiddag er CAD & CAE softwareudvikler Dassault Systèmes årlige messe, den passende navn SOLIDWORKS World. En af de store årlige sammenkomster for hardware og software leverandører af arbejdsstationer, bruges ofte som baggrund for at annoncere nye produkter. Og i år gør NVIDIA netop det med en bogstavelig Big Pascal produktlancering til arbejdsstationer.

Sidste gang vi checkede ind på NVIDIAs Quadro workstation-videokortgruppe, havde de netop lanceret Quadro P6000. Baseret på en fuldt aktiveret version af NVIDIAs GP102 GPU, var P6000 det første high-end Quadro-kort, der blev frigivet baseret på Pascal-generationen. Dette er en bemærkelsesværdig forskel, da NVIDIAs GPU-produktionsstrategi er ændret siden Kepler og Maxwells dage. NVIDIAs største GPU løber ikke længere tredobbelt på tværs af forbrugere, arbejdsstationer og servere. I stedet er serveren (og bredere beregningsmarkedet) stort nok til at retfærdiggøre at gå all-in på en computerkentrisk GPU. Dette resulterede i, at Big Pascal kom til livet som den unikke GP100, mens NVIDIAs grafiske arbejdshest var den mindre og mere konventionelle (men stadig meget kraftfulde) GP102.

På grund af denne opdeling i NVIDIA GPU-design, var det ikke klart, hvor denne nye computerbaserede GPU ville passe ind på tværs af NVIDIAs produktlinjer. Det er selvfølgelig rygraden på Tesla-serverkort, og i mellemtiden er det meget usandsynligt, at de kommer op i forbrugerne GeForce-produkter. Men hvad med Quadro-markedet, som i tidligere generationer har taget hensyn til både grafik og beregne brugere i high-end (hvis kun på grund af den blandede brug af tidligere generationens GPU'er)? Svaret, som det viser sig, er, at Big Pascal trods alt har et sted i Quadro familien. Og det er et interessant sted øverst at NVIDIA kalder Quadro GP100.

Baseret på NVIDIAs GP100 GPU, er Quadro GP100 en simpel forklaring på grund af GP100s unikke sted i NVIDIAs Pascal GPU-familie. Quadro GP100 på den ene side en retur til form for NVIDIAs Quadro lineup. Det er jacket på alle handler kort, der gør alt - grafik og beregne - herunder funktioner, som Tesla kortene ikke tilbyder, et job tidligere opfyldt af kort som Quadro K6000. På den anden side er det ikke nødvendigvis NVIDIAs mest kraftfulde arbejdskort: På papir er FP32 / grafik ydeevne lavere end Quadro P6000s. Så hvor passer Quadro GP100 ind i det store billede?

Det lange og korte er, at Quadro GP100 er beregnet til at være et Tesla / GP100-kort til arbejdsstationer, men med endnu mere funktionalitet. Mens NVIDIA tilbyder PCIe Tesla P100 kortdisse kort har kun passiv køling og er designet til servere; Manglen på aktiv køling betyder, at du ikke kan sætte dem i (konventionelle) arbejdsstationer. Quadro GP100 på den anden side er et traditionelt, fan & shroud aktivt afkølet kort, ligesom resten af ​​Quadro lineup. Og så stopper NVIDIA ikke der, hvilket muliggør grafikfunktionalitet, der ikke er på Tesla-kortene. Det faktum, at NVIDIA ikke engang giver det et P-serien navn - snarere navngiv det efter GPU'en nedenunder - er et godt antydning af, hvor NVIDIA går.

NVIDIA Quadro Specifikation Sammenligning
GP100P6000M6000K6000
CUDA Cores3584384030722880
Texture Units224240192240
ROPs128?969648
Boost Clock~ 1430MHz~ 1560MHz~ 1140MHzN / A
Memory Clock1.4 Gbps HBM29Gbps GDDR5X6.6Gbps GDDR56Gbps GDDR5
Hukommelse Bus Bredde4096-bit384-bit384-bit384-bit
VRAM16GB24GB24GB12GB
ECCJaIngenIngenJa
FP641 / 2 FP321 / 32 FP321 / 32 FP321 / 3 FP32
TDP235W250W250W225W
GPUGP100GP102GM200GK110
arkitekturPascalPascalMaxwell 2Kepler
Manufacturing ProcessTSMC 16nmTSMC 16nmTSMC 28nmTSMC 28nm
Frokost aftalemarts 2017oktober 201603 / 22 / 201607 / 23 / 2013

Quadro GP100 sættes derefter i en interessant blanding af brugere. For at beregne brugere, der har brug for et arbejdsstations-egnet GP100-kort, så er Quadro GP100 ment at være deres kort. Det tilbyder alle GP100s kernefunktioner, herunder ECC-hukommelse, FP64 med halv hastighed og instruktioner med dobbelt hastighed (pakket) FP16. Som en tilføjet kicker introducerer Quadro GP100 en ny NVLink-stik til PCIe-kort. Dette gør det muligt for et par Quadro-kort at blive oprettet i en 2-vejs NVLink-konfiguration, der medfører NVLInk's hukommelsesadgang og ydelser med lav latenhedsoverførsel til PCIe-kort. Dette er især ikke tilgængeligt på Tesla PCIe-kortene.

Som NVIDIA diskuterer det, lyder de ganske sikker på, at Quadro GP100 vil sælge godt til at beregne brugere og med god grund. Tesla P100-kortene har været et hit med neurale netværksprogrammerere, og nu har forskere et kort, der er egnet til at slippe ind i en arbejdsstation for at udvikle sig imod.

I mellemtiden er det andet marked for Quadro GP100 det traditionelle high-end CAD / CAE-marked. For de mere specialiserede brugere, der har brug for et arbejdskort med hurtig FP64 ydeevne og ECC-hukommelse for maksimal nøjagtighed og pålidelighed, er Quadro GP100 det første Quadro-kort, da K6000 tilbyder den funktionalitet. Det kan nok være lidt af en niche, da de fleste CAD-brugere ikke behøver den slags pålidelighed, men for dem, der gør for komplekse tekniske simuleringer og lignende, er det kritisk (for ikke at nævne et lukrativt marked for NVIDIA). Servicere dette marked gør også Quadro GP100 unik, fordi det er det eneste GP100-kort med dets grafiske funktionalitet tændt.

Men når det kommer til de grafiske arbejdsbyrder, er det her, hvor linjen mellem Quadro GP100 og P6000 bliver meget mildere. Quadro P6000 er klassificeret til 12 TFLOPS FP32, i modsætning til GP100s 10.3 TFLOPS, og på samme måde har Quadro GP100 også omkring 86% af teksturflowet. Papirspecifikationer er ikke alt selvfølgelig, men i rene SM-gennemløbsbaserede scenarier bør P6000 være det hurtigere kort. Dette er fordelen ved den mere kompakte (og fremstillbare) GP102 versus den massive GP100.

Den ene jokertegn her er HBM2-hukommelsesgrænsefladen og tilhørende ROP'er. NVIDIA bruger specifikt Quadro GP100 som den hurtigste rendering ydeevne, og afhængigt af scenariet, der meget vel kan være tilfældet. Med 720GB / sek hukommelsesbåndbredde - takket være 4 HBM2-stakke klokket på 1.4Gbps hver - Quadro GP100 har 66% mere hukommelsesbåndbredde end Quadro P6000s blotte 432GB / sek. Sammen med hvad der næsten helt sikkert er en fordel for ROP-tæller - har NVIDIA endnu ikke afsløret GP100s ROP-tæller, men baseret på hvad vi ved af GP102, er 128 ROPs et sikkert bet - og Quadro GP100s rene pixel-pusheffekt skal være større end endda P6000 af omkring 22%. Da CAD / CAE kan være meget pixelbundet, og dette burde være en konkret fordel for nogle Quadro-kunder.

Den ene ulempe er dog hukommelseskapacitet. Mens Quadro P6000 tilbyder 24GB af VRAM på grund af den større praktiske kapacitet GDDR5X, ligesom alle GP100 produkter, går Quadro GP100 ud på 16GB af HBM2. Det betyder, at en enkelt Quadro GP100 til meget store datasæt brugere er meget mindre end hvad de kan komme ud af P6000. Det er værd at bemærke, at NVIDIA bruger NVLink til at hjælpe med problemer med hukommelsesknap, men jeg formoder, at det er forankret i beregning mere end grafik.

På den måde, uden for GPU'en nedenunder, pakker Quadro GP100 de typiske Quadro-familie hardwarefunktioner. Dette omfatter 4 DisplayPort 1.4-porte og en enkelt DVI-port til displayudgange, og NVIDIA klassificerer det som VR Ready også. I mellemtiden mod bagsiden af ​​kortet er Quadro Sync og Stereo-stikene for henholdsvis synkroniseret opdatering og quadbufret stereo.

Indpakning af ting, som resten af ​​Quadro-kortene lanceres i dag, forventer NVIDIA, at Quadro GP100 skal sendes i marts. Prissætning er endnu ikke bestemt, men da Quadro GP100 er GP100-kortets jack-of-all-trades, bliver jeg fortalt, at prissætningen vil være lidt lidt over Quadro P6000, hvilket ville sætte den et sted nord for $ 5,000.

Kilde

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.