AMD Zen og Ryzen 7 Review: En dyb dykke på 1800X, 1700X og 1700

I over to år har den kollektive AMD vs Intel personlige computerskamp sidder på kanten af ​​sit sæde. Tilbage i 2014, da AMD først annoncerede, at den forfulgte en helt ny mikroarkitektur, fortalte gamle hænder de dage, hvor kampen mellem AMD og Intel var sjovt at være en del af, og brugere var glade for at konkurrencen førte til innovation: ikke kort efter , blev Core-mikroarkitekturen den dominerende kraft i moderne personlig databehandling i dag. Gennem de forskellige pressemeddelelser cykler fra AMD stammer fra den oprindelige Zen meddelelse, industrien er i en pisket vanvid venter på at se om AMD, gennem rehiring guru Jim Keller og lægge grundlaget for et bredt og dybt processor team i det næste årti, kan hold den etablerede til konto. Med AMDs første brug af en 14nm FinFET-knude på CPU'er, er dagen i dag Zen, der rammer hylderne, og benchmarkresultater kan udgives: Spil på!

[En sidebesked for alle, der læser dette i marts 2nd. Det meste af gennemgangen er færdig, bære et redigeringspas eller to. De fleste af resultatsiderne har grafer, men ingen tekst. Vær tålmodig, mens vi er færdige.]

Lancering af en CPU er som en løg: Der er lag

Som AnandTech flytter ind i sin 20th årsdag, ser det ud til at være bemærkelsesværdigt at bemærke, at en af ​​vores første store revisionsstykker, der blev kendt, tilbage i 1997, var på en ny AMD-processorlancering. Vores stil og test regime siden da har udvidet og diversificeret gennem performance, gaming, microarchitecture, design, feature-set og debugging marketing strategi. (Fair play til Anand, han var kun 14 år gammel siden da!). Vores anmeldelse for Ryzen sigter mod at omfatte mange af de områder, vi føler sig relevante for omfanget af dagens lancering.

Et interview med Dr. Lisa Su, administrerende direktør for AMD
Produktstart: En lille stak CPU'er
Mikroarkitektur: Front-End, Back-End, micro-op cache, GloFo 14nm LP
Chipsets og bundkort: AM4 og 300-serien
Kølere og hukommelse: Wraith og DDR4
Benchmarking Performance: Vores nye 2017 CPU Benchmark Suite
konklusioner

Før den officielle lancering afholdt AMD en traditionel "Tech Day" for nøglepresse og analytikere i den sidste uge i San Francisco. Målet med Tech Day var at forklare Zen til pressen, før pressen forklare det for alle andre. AMD kan lide at lave Tech Days med de seneste begivenheder i hukommelsen, der dækker Polaris og Carrizo, og jeg bebrejder dem ikke: sammen med de sædvanlige slidepræsentationer, der genvinder det, der allerede er kendt eller ISSCC / Hot Chips-papirer, får vi også en chance for at sætte sig ned med VP'er og C-Level ledere samt de ledende ingeniører, der er involveret i produkterne. Nogle af oplysningerne i dette stykke, vi ville have offentliggjort før: AMDs maskine med kildedannelse-information betyder, at vi allerede har en god ide bag designet, men Tech Day hjælper os med at stille de sidste spørgsmål sammen med de officielle lanceringsdetaljer.

Så hvad er Zen? Eller ryzen?

En kort backstory og kontekst

Verden af ​​de vigtigste systemprocessorer, eller CPU'er i dette tilfælde styres på højt niveau af arkitektur (x86, ARM), mikroarkitektur (hvordan siliconen er lagt ud) og procesknude (såsom 28HPM og 16FF + fra TSMC, eller 14LP fra GloFo). Udover disse har vi problemer med dørområdet, strømforbruget, transistorlækage, omkostning, kompatibilitet, mørk silicium, frekvens, understøttede funktioner og tid til marked.

I løbet af det sidste årti har både AMD og deres hovedkonkurrent Intel konkurreret om desktop- og servercomputermarkederne med processorer baseret på x86 CPU-arkitekturen. Intel flyttede til sin førende Core-mikroarkitektur på 32nm omkring 2010, og er i øjeblikket i sin syvende generation på 14nm, hvor hver generation implementerer forskellige front-end / back-end-ændringer og designjusteringer til cacher og / eller modularitet (det er faktisk meget mere komplekst end dette). Til sammenligning kører AMD sin fjerde / femte generation Bulldozer-mikroarkitektur, delt mellem sine high-end CPU'er (kører en ældre 2-generation på 32nm), dens mainstream-grafikorienterede APU'er (kører 4th / 5th Generation on 28nm) og bærbare- baserede APU'er (på 5th Generation).

High Performance og Mainstream
x86 mikroarkitekturer
AMD År Intel
Zen 14FF 2017 ?
Gravemaskine v2 GF28A 2016 14 + FF Kaby Lake
Gravemaskine GF28A 2015 14FF Skylake
Steamroller 28SHP 2014 14FF Broadwell
- - 2013 22FF Haswell
Rambuk 32 SOI 2012 22FF Ivy Bridge
Bulldozer 32nm 2011 32nm Sandy bro
- - 2010 32mm Westmere
K10 45nm Øvrige 45nm Nehalem

AMDs bulldozer-baserede design var et ambitiøst mål: typisk vil en processorkerne have et enkelt instruktion indgangspunkt, der fører til en dekodering, så afsendelse til adskilte heltal eller flydende punktplanlæggere. Bulldozer fordoblet integerplanlæggeren og gennemgangskapaciteten og tillod modulet at acceptere to tråde af instruktioner - det betød, at integerbelastede arbejdsbelastninger kunne klare sig godt, andre flaskehalser trods det. Opfattelsen var, at de fleste OS-baserede arbejdsbyrder altid er heltal / hele nummerbaserede, såsom loop iterations eller true / false Boolean sammenligninger eller predicates. Desværre endte designet med et par nøgleproblemer: OS-baserede arbejdsbyrder endte med at få mere flydende punkt tunge, traditionelle operativsystemer forstod ikke, hvordan man afsendte arbejde med et dobbelt tråd modul, der førte til overbelastede moduler (dette blev rettet med en opdatering) var generel gennemstrømning af en enkelt tråd en lille (hvis nogen) opgradering over det foregående mikroarkitektur design, og strømforbruget var højt. En række førende analytikere pegede på designfilosofier i Bulldozer-designet, såsom en gennemskrevet L1-cache og en delt L2-cache inden for et modul, der fører til højere ventetider og øget strømforbrug. En god del af underskuddet til konkurrencen var manglen på en micro-op-cache, der kan hjælpe med at omgå instruktionskodeffekt og latens samt en procesnode ulempe og den etablerede stærke hukommelse præ-hente / gren forudsigelse evner.

Den nyeste generation af Bulldozer, der bruger 'Gravator'-kerner under Carrizo-navnet til chipet som helhed, er faktisk et stort spring fra det oprindelige Bulldozer-design. Vi har haft omfattende anmeldelser af Carrizo til bærbare computere, samt en gennemgang af den eneste Carrizo-baserede desktop-CPU, og den endelige variant fungerede meget bedre for et Bulldozer-design end forventet. Den grundlæggende basisfilosofi var uændret, men brugen af ​​nye GPU'er, en ny metalstabel i silicondesignet, ny overvågningsteknologi, nye gevind- / forsendelsesalgoritmer og nye interne analyseteknikker førte til en lavere ydelse med højere ydelse. Dette var på bekostning af super high-end-performance over35W, og chipet blev derfor konstrueret til at fokusere på mere almindelige priser, men mange af teknologierne bidrog til at bane vejen for den nye Zen-plan.

Zen er AMDs nye mikroarkitektur baseret på x86. At bygge en ny grundmikarkitektur er ikke let - det betyder typisk et stort paradigmeskifte i tankegangen mellem det gamle design og det nye design på nøgleområder. I de senere år har Intel udskiftet centrale mikroarkitekturændringer mellem to separate CPU-designteams i USA og Israel. For Zen har AMD gjort skridt til at opbygge et hold, der er egnet til at vende tilbage til high-end. Måske var den mest fremtrædende nøgleudlejning CPU Architect og all-around roste designguru Jim Keller. Jim har en fremtrædende historie inden for chipdesign, der begynder med likeså Freescale, til at udvikle chips til AMD, når de kæmper med tand og negle med Intel i de tidlige 2000'er og derefter videre til Apple for at arbejde på A5 / A6-design. AMD kunne genanvende Jim og sætte ild i sin mave med sætningen: 'Lav en ny højtydende x86 CPU' (ikke i de nøjagtige enkle ord ... .Jeg håber).


Fra venstre til højre: Mark Papermaster (CTO AMD), Dr Lisa Su (CEO AMD),
Simon Segars (CEO ARM) og Jim Keller (tidligere AMD, nu Tesla)

Jims mål var at opbygge holdet og lægge grunden til den nye mikroarkitektur, som på lang sigt vil dreje sig om AMD Processor Architect Michael (Mike) Clark. Tidligere Intel-ingeniør Sam Naffziger, der allerede arbejdede med AMD, da Zen-teamet blev sat sammen, arbejdede sammen med Carrizo og Zen-holdene om at bygge interne beregninger for at hjælpe med kraften. Mark Papermaster, CTO, har udtalt, at over 300 dedikerede ingeniører og to millioner mand-timer er blevet sat i Zen siden starten.

Som nævnt var målet at fastlægge en ramme. Jim Keller tilbragte tre år på AMD på Zen, før han forlod at tage stilling under Elon Musk på Tesla. Da vi rapporterede, at Jim havde forladt AMD, syntes en række personer i branchen forvirret: Zen var ikke på grund af et andet år i bedste fald, hvorfor var han så tilbage? Svarene fra AMD var enkle - Jim og andre havde bygget teamet og lagde grunden til Zen. Med alle de store byggesten på plads, og simuleringer med gode resultater, var alt, hvad der var brug for, finjustering. Finjustering er mere kompleks end det lyder: Få caches til at opføre sig korrekt, flytte data omkring stoffet med højere hastigheder, få den ønskede hukommelse og latency ydeevne, få styrken under kontrol, arbejde med Microsoft for at sikre OS-kompatibilitet og arbejde med halvlederen fabs (i dette tilfælde GlobalFoundries) for at forbedre udbyttet. Ingen af ​​dette er typisk påvirket af manden i toppen, så Jims job blev gjort.

Det betyder, at AMD i det forløbne år har arbejdet på den finjustering. Derfor har vi langsomt set flere og flere oplysninger, der kommer ud af AMD vedrørende mikroarkitektur og nye funktioner som de finjusterende slots på plads. Alt dette kulminerer i Ryzen, det officielle navn til dagens lancering.

Sammen med den nye mikroarkitektur er Zen den første CPU fra AMD, der skal lanceres på GlobalFoundries '14nm-proces, som er semi-licenseret fra Samsung. Ved en basisoversigt skal processen tilbyde 30% bedre effektivitet over 28nm HKMG (high-metal gate) -processen, der anvendes ved TSMC for tidligere produkter. Et af de problemer, der står overfor AMD de sidste par år, har været Intels dygtighed i fremstillingen, først ved 22nm og derefter på 14nm - begge ved hjælp af iterative FinFET generationer. Dette gav et effektivitets- og die-size-underskud til AMD uden nogen reel fejl: At omdanne ældre Bulldozer-afledte produkter til en mindre proces er både vanskelig og giver meget spild afhængigt af, hvordan mikroarkitekturen er designet. Flytning til GloFo '14nm på FinFET sammen med en ny mikroarkitektur designet til denne specifikke knude, er en skridt til at spille spillet med avanceret CPU-ydeevne.

Men at vende tilbage til high-end CPU ydeevne er svært. Der er to rå måder at måle ydeevne på: samlet gennemstrømning eller perkernet gennemstrømning. Har en lav perkernet gennemgang, men ved hjælp af masser af kerner for at øge den samlede gennemstrømning, er der allerede et glimrende eksempel på grafikkort, som hovedsagelig er mange små dedikerede vektorprocessorer i en enkelt chip. Til almindelig databehandling ser vi design som ThunderX, der sætter 64 + ARM kerner i en enkelt chip eller Intels egen Xeon Phi, der har op til 72 x86 kerner som en hostprocessor (blandt andre). Alle disse har forholdsvis lav generelle kernepræstationer med generelle formål, enten fordi de fokuserer på specifikke arbejdsbyrder, deres arkitektur, eller de skal køre ved super-lav frekvens for at være inden for et bestemt strømbudget. De er stadig højtydende, men den sande krone ligger med en god præstation. Per-core er hvor Intel har vundet, og den nyeste Skylake / Kaby Lake-mikroarkitektur er førende på grund af den måde, hvorpå kernen er designet, indstillet og produceret på den mest konkurrencedygtige produktionsprocesknude, der er rettet mod høj ydeevne og effektivitet.

Med Zen-mikroarkitekturen var AMDs mål at vende tilbage til avanceret CPU-ydeevne, eller igen at have en konkurrencedygtig perkernevirksomhed igen. At forsøge at konkurrere med høj frekvens, mens du springer strømbudgetet, som det ses med FX-9000-serien, der kører ved 220W, ville ikke skære det. Basisdesignet skulle være effektivt, lavt latent, kunne fungere ved høj frekvens og skalere ydeevne med frekvens. Typisk pr. Kerneydelse måles i forhold til 'IPC' eller instruktioner pr. Klok: En processor, der kan udføre flere operationer eller instruktioner pr. Hz eller MHz, har en højere ydeevne, når alle andre faktorer er ens. I AMDs indledende meddelelser om Zen blev målet om en 40% gevinst i IPC sat ind i økosystemet uden nogen stigning i strømmen. Det er relevant at sige, at der var tvivl, og mange entusiaster / analytikere var tilbageholdende med at hævde, at AMD havde ressourcerne eller nous til begge at øge IPC af 40% og bevare strømforbruget. Under normale omstændigheder, uden et væsentligt paradigmeskift i designfilosofien, kan en 40% gevinst i effektivitet være en wild goose chase. Så blev det indset, at AMD foreslog en + 40% gevinst i forhold til den bedste version af Bulldozer, hvilket rejste endnu flere spørgsmålstegn. Ved den formelle lancering i sidste uge udtalte AMD, at slutmålet blev opnået med + 52% i standardstandarder for industrien, som SPEC fra Piledriver-kerner (med en L3-cache) eller + 64% fra Gravorkerner (ingen L3-cache).

Flytter tættere på lanceringen, og med flere detaljer under vores bælter, var det klart, at AMD ikke sjovede, men faktisk var realistisk. Analyse af det, vi fik at vide om kernesignalet (vi blev ikke fortalt alt til at begynde med) synes at tyde på, at AMD gennem dette langsigtede CPU-team og kerneplan har alle de nødvendige blokke til at gøre gærningen . Bortset fra at få en faktisk chip til hånd for at teste, var analytikere stadig bekymrede for AMDs evne til at udføre både til tiden og tilstrækkeligt til at gøre en buk og genskabe et yderst konkurrencedygtigt x86-marked.

Gennem Zen-konceptets levetid på AMD har de set et par virksomhedsmæssige omstruktureringer, ændringer hos de højtstående ledere på C-niveau, den tid, hvor virksomhedsværdien er dyppet under virksomhedens aktivværdi, omstrukturering af produktion og wafer omhandler GlobalFoundries (hvilket blev spundet ud af AMD før Zen), salg og re-leasing af større firmabygninger og integrationen / de-integrationen af ​​grafikholdet i virksomheden. Inden for alt det gjorde Bulldozer ikke den indflydelse, den havde brug for, dels på grund af hype og undervældende resultater før lanceringen. Salgsmængderne er faldet (dels på grund af lavere global efterspørgsel på pc) og serverbaserede indtægter er faldet til næsten nul, da vi ikke har set en ny Opteron om fem år. Kort sagt er indtægterne faldet. AMDs evne til at få deres økonomi under kontrol, og derefter fokusere og udføre, har været under spørgsmålet.

I de seneste par måneder er der sket et forandringer. De øverste fire ledere involveret i Zen, Dr. Lisa Su (CEO), Mark Papermaster (CTO), Jim Anderson (CVP Client) og Forrest Norrod (CVP Server) har været stabile i virksomheden i et par år, og alle fire har den luft af stille tillid. Det er ret overraskende at se tre traditionelle processor ingeniører øverst i kæden for en CPU-lancering, snarere end en salgs- eller marketingfokuseret udøvende - typisk er en ingeniør, der frigiver et produkt med et grin på deres ansigt, ofte et godt tegn. Bortset fra det er AMDs semi-custom indtægter steget ved at sikre tilbud på de førende konsoller, GPU-siden af ​​virksomheden (Radeon Technology Group, under Raja Koduri) med succes udført på 14nm med mainstream-dele i 2016, og for den tillid har AMD handler nu på over $ 12 / share, lige under deres 2004 / 2005 peak. I øjeblikket er et stort antal individer og virksomheder investeret i AMD efterfulgt af både forbrugere og økonomi, og den seneste præstation med udførelse har været en positiv faktor.

Siden august har AMD forsket på Zen-mikroarkitekturen i den faktiske præproduktionssilicium, kører Windows og kørende benchmarks. Med 40% + gevinsten i IPC konstant citeret, og nu en + 52% præsenteres, vil de fleste brugere og interesserede gerne vide præcis, hvor det sidder i forhold til et tilsvarende Intel-produkt. Tilbage i august udførte AMD en enkelt, næsten helt afviselig benchmark, der viser tilsvarende IPC af Zen med Broadwell-E (læs vores skrivning herom og grunde til, at det er svært at fortolke et enkelt benchmark). AMD havde en 'New Horizons' (Ho-Ryzen, få det?) Arrangement i december og meddelelser på CES i januar, der viser præstationer i spil og kodning, især håndbremse. Det er værd at bemærke, at Intel, som du ville forvente nogen konkurrent, gik igennem hvert open source-projekt. AMD havde brugt en implementeret opdatering til at hjælpe døde / dårlige kodekser (f.eks. Sammenlægning læses / skrives for at overholde AMD / Intel design retningslinjer) eller tilbyde forbedringer (tilføjer i 256-bit vektorkoder for at kombinere 128-bit beregning i sammenhæng *), hvorfor nogle af resultaterne fra lanceringen i dag er forskellige fra, hvad AMD har vist. (Hvis nogen mener, at dette er "uretfærdigt", er det et større spørgsmål om, hvordan IPC er et godt mål for ydeevne, hvis koden er IPC, der begrænser sig selv, hvilket er et emne for en anden dag.) På Tech Day gik AMD ind i Nærmere detaljer om forskellige interne benchmarks, både CPU og gaming relateret, der viser enten nær paritet eller en retfærdig fordeling af win / loss metrics, men i sidste ende giver bedre pris / ydeevne.

* I dette tilfælde skaber 4 x 128-bit vektormatemat normalt 4 ops. Arrangering af kode til 256-bit kan give 2 x 256-bit til to ops, som tager to cykler på Zen per kerne, men kun en cyklus på Intels nyeste.

For nylig holdt AMD en tale på ISSCC (International Solid State Circuits Conference), som vi vil gå ind som en del af denne anmeldelse, men en ting er værd at nævne her. Sammen med AMD, der kræver, at Zen har god single thread performance, ønskede de også noget lille. På ISSCC viste AMD et dias, der sammenlignede en Zen die skudt til et "konkurrent" (sandsynligvis Skylake) dørområde:

Her sammenligner AMD en fire-kerne del til en fire-kerne del, der viser, at mens AMD's L2 er større, er finhældningen større, metalhøjden er større, og dens SRAM-celler er større, quad-kerneudformningen på 14nm GloFo er mindre end 14nm Intel. Dette skyldes praktisk talt den måde, hvorpå Zen-kernerne er designet mod Intel-kerner - den simple forklaring er, at Intel-kernerne har bredere eksekveringsporte (f.eks. At behandle en 256-bit vektor i en mikro-op i stedet for to) og vi mistanke om et større område dedikeret til hente logik. Der er også overvejelse om mørkt silicium, som hjælper med at hjælpe det termiske miljø omkring de logiske enheder, hvilket ikke er afsløret.

Jeg nævner dette, fordi en af ​​AMDs mål, bortset fra den vigtigste af 40% + IPC, er at have små kerner. Som følge heraf, som vi vil se i denne anmeldelse, er der lavet forskellige afvejninger. I stedet for at dedikere et større dysområde til udførelsesporte, der understøtter AVX på én gang, besluttede AMD at bruge 2 × 128-bit vektorunderstøttelse (som 1 × 256), men øg størrelsen af ​​L2-cachen. En større L2 vil sikre færre cachefejl i varieret kode, måske på bekostning af high-end computere, der kan udnytte større vektorer. Den større L2 hjælper med single thread performance (alle andre faktorer er ens), og AMD ved, at Intels cache er høj ydeevne, så vi vil se andre afvejninger som dette i designet. Dette er naturligvis kombineret med AMDs seneste arbejde med at have biblioteker med høj densitet til cache og beregne.

AMD har allerede udarbejdet en køreplan for forskellige markeder med produkter baseret på Zen-mikroarkitekturen. Dagens lancering er den første produktlinje, nemlig desktop-class processorer under Ryzen 7-familienavnet. Efter Ryzen 7 bliver Ryzen 5 (Q2) og Ryzen 3 (2H17) til skrivebordet. Der er også AMDs nye serverplatform, Napoli, med op til 32 kerner på en enkelt CPU (vi diskuterer Napoli senere i anmeldelsen). Vi forventer, at Napoli er i Q2 / Q3 tidsrammen. I andet halvår af dette år (Q3 / Q4) planlægger AMD at lancere mobile processorer baseret på Zen, kaldet Raven Ridge. Denne processor line-up vil højst sandsynligt være med integreret grafik, og det vil være interessant at se, hvor godt mikroarkitekturen skaleres ned i lav effekt. Da Ryzen CPU'er er rettet mod en mere målrettet målgruppe, og at de ikke har integreret grafik, vil AMD også opretholde sin linje af 'Bristol Ridge' platformen (Gravemaskiner baseret processorer, der også understøtter 300-serien). Målet med Bristol Ridge er at udfylde i den lave ende eller til systemer, der ønsker mulighed for diskret grafik. På baggrund af det, vi har set i benchmarks, på trods af de seneste udsagn fra AMD tværtimod synes FX-linjen for AM3 + CPU'er at komme til en ende.

For brugere, der ønsker at købe dele i dag, er her de relevante oplysninger, du skal vide. Ryzen CPU'erne kommer til at indgå i 'Summit Ridge' platformen - 'Summit Ridge' angiver en Ryzen CPU med et 300-serie chipsæt (X370, B350, A320). Både Bristol Ridge og Summit Ridge og dermed Ryzen betyder, at AMD gør hoppet til en desktop platform, der understøtter DDR4 og en high-end desktop platform, der understøtter PCIe 3.0 indbygget. Disse CPU'er anvender AM4-stikket på 300-seriens bundkort, som ikke er kompatibelt med nogen af ​​AMDs tidligere stikdåseudformninger, og har også lidt forskellige stophuller for CPU-kølere, der ikke bruger AMD's låsmekanisme. På trods af udskiftning af hulhullestørrelse har AMD holdt låsemekanismen på samme sted, men kølere, der har deres egne bagplader, skal bruge nye understøtningsplader til at kunne bruges (vi har lidt på dette senere i anmeldelsen som godt).

Kilde

Giv en kommentar

Dette websted bruger Akismet til at reducere spam. Lær, hvordan dine kommentardata behandles.