qlc_575px.png

Kioxia: 3D Stacked Storage Class Memory, tulad ng 3D XPoint, ay hindi ang Hinaharap

Ang isa sa mga pangunahing larangan ng labanan sa susunod na dekada ay magiging imbakan: density, bilis, at demand. Naturally lahat ng mga pangunahing manlalaro sa espasyo na nais na itaguyod ang kanilang sariling mga teknolohiya ng kanilang mga katunggali, at ang Kioxia (dating Toshiba Memory) ay hindi naiiba. Ngayong taon sa panahon ng kanilang plenary talk sa International Electron Device Meeting (IEDM) ay itinakda ng kumpanya ang promosyon nito ng BiCS flash product family, pati na rin ang paparating na teknolohiya ng XL-Flash. Ang nakawiwili sa pag-uusap na ito ay isang grapong tila nagpapabagal sa pangmatagalang mga prospect ng alinman sa paparating na mga Computer Class Class (SCM) na teknolohiya tulad ng 3D XPoint mula sa Intel at Micron.

Memory (DRAM) vs Imbakan (Flash) kumpara sa 'Storage-Class' Memory (SCM)

Ang memorya sa pangunahing antas nito ay ang pagkakaroon ng isang ari-arian ng isang cell na maaaring kalkulahin at ma-convert sa data. Ang isang simpleng cell DRAM ay naglalaman ng mga electron, at ang pagkakaroon / kawalan ng mga elektron ay matukoy kung ang halaga ng cell na iyon ay isang 1 o isang 0. Ang memorya ng pag-iimbak ng Flash ay dumaan sa maraming mga pagbabago sa nakaraang ilang mga dekada, na may lumulutang na gate at singilin ang mga teknolohiya ng bitag tumutulong sa pagmamaneho sa pagmamanupaktura at scaling ng imbakan. Ang mga bagong uri ng memorya ay nasa iba't ibang estado ng pag-unlad / paggawa / pagpapadala na umaasa sa paglaban ng daluyan sa cell, o ang pag-ikot ng daluyan sa cell, sa halip na boltahe.

Ayon sa kaugalian madali itong isipin ang bawat cell bilang isang tuwid na pasulong 0 o 1, sa o off, na may dalawang natatanging antas ng pagtuklas. Gayunpaman, depende sa uri ng mga materyales na ginamit, maaari itong tuklasin ang maraming mga antas sa loob ng isang solong cell. Ang industriya ay lumipat mula sa 1-bit bawat cell (0 o 1) hanggang 2-bits bawat cell (00, 01, 10, 11) hanggang sa 3-bits bawat cell (000, 001, 010, atbp) at pasulong, kasama ang nangungunang imbakan mga produkto ngayon sa apat na mga bit bawat cell at tinitingnan kahit na higit pa rito. Ang memorya ng oras ng 'DRAM' ay palaging isang 1-bit bawat daluyan ng cell, subalit ang imbakan ay dumadaan sa mga galaw ng pagtaas ng bilang ng mga bit bawat cell. Ang paglipat sa higit pang mga bit bawat cell ay nakakakuha ng labis na kapasidad ng pag-iimbak, sa bisa, para sa 'libre', gayunpaman hinihiling nito ang mga materyales na magkaroon ng mas magaan na pagpapaubaya at ang pagtukoy ng circuitry upang maging mas tumpak, at isang paraan upang gawin ang pareho ng mga ito ay upang madagdagan ang laki ng cell, binabawasan ang density ng pangkalahatang. Ang higit pang mga bit sa bawat cell, ang kahirapan ay nagiging pagkilala sa pagitan ng mga antas ng pag-aari sa 2 hanggang sa lakas ng bilang ng mga bit. Ito ay isang kawili-wiling conundrum.

Ang kasalukuyang teknolohiya ng imbakan ng flash ng Kioxia ay nakasalalay sa pag-stack ng maraming mga layer ng lumulutang na mga cell ng gate sa isang tower, at pagkatapos ay ulitin ang disenyo na iyon sa mga xy na direksyon upang madagdagan ang kapasidad. Ang Kioxia ay kasalukuyang nagpapadala ng maraming 3-bit bawat cell at 4-bit bawat cell cell, kasama ang kumpanya na tumitingin sa 5-bit bawat cell para sa mga espesyal na aplikasyon. Ang pamilya ng BiCs ng mga produkto ay din ang pagtaas ng bilang ng mga layer sa disenyo nito, mula sa 32 layer hanggang 48 layer hanggang 64 layer at ngayon ay hanggang sa 96-layer, na may 128+ layer sa hinaharap na darating. Ang pagdaragdag ng mga layer, sa pamamagitan ng kaibahan sa iba pang mga pamamaraan, ay medyo madali.

Ang Kioxia ay nagtatayo din ng isang bagong uri ng Flash na tinatawag na XL-Flash, na muling nagdaragdag ng isa pang layer ng pagkakatulad sa konsepto ng flash.

Ang Pag-iingat ng Class Class ay bahagyang naiiba sa tradisyonal na memorya ng flash. Gumagana ang memorya sa antas ng pag-access ng 'bit', habang gumagana ang flash memory sa isang 'pahina' at antas ng 'block'. Nangangahulugan ito na habang ang DRAM ay maaaring ma-access ang bawat bit at baguhin ito, sa flash ito ay nangangahulugan na ang anumang operasyon ng pagsulat sa flash ay nangangailangan ng isang buong pahina na isulat nang sabay-sabay. Nangangahulugan ito na ang bawat operasyon ng read-modify-write ay kailangang basahin ang buong pahina, piliin kung aling mga bits ang babaguhin, at muling isulat ang pahina nang buo. Pinatataas nito ang pagsusuot sa drive (ang bilang ng mga nabasa / pagsulat ng mga siklo), at maraming mga diskarte sa paglalaro upang mabawasan ang pagsusuot sa pamamagitan ng leveling ng pagsusuot, ekstrang imbakan ng lugar, at iba pa. Ang memorya ng kaibahan ay kailangang gumana nang kaunti, at bawat isa ay kailangang mapili at madaling iakma - ang 'memorya ng memorya ng pag-iimbak ay dapat na kumilos tulad ng memorya sa lahat ng oras, at pagkatapos ay magamit para sa mga kadahilanan ng imbakan kung maaari. Ang pakinabang ng memorya ay nilalayong maging walang hanggan (> 10 ^ 18) cycle ng buhay at mababang pag-access, ngunit hindi ito palaging madali.

Ang mga 3D Stacked na mga cell ng memorya ng memorya ay gumagana ng kaunting naiiba sa flash. Ang pinakamadaling halimbawa dito ay ang 3D XPoint, na gumagamit ng materyal na pagbabago sa phase upang mabago ang paglaban ng isang cell ng memorya, at na-access sa pamamagitan ng isang switch ng ovonic selector. Ang memorya ay nabuo sa pamamagitan ng pag-alternate ng direksyon ng mga linya ng salita at mga linya ng linya upang mapanatili ang bit-addressable na kalikasan ng SCM. Upang magdagdag ng higit pang mga layer, ang ideya ay ang karagdagang mga salita at bit na linya ay idinagdag, kasama ang mga cell na nasa pagitan.

Ang 3D SCM ba ang Hinaharap?

Bakit sa tingin ni Kioxia na ang 3D Stacked SCM ay hindi ang hinaharap? Dumiretso ako sa graph na pinag-uusapan.

Narito mayroon kaming dalawang linya na nagpapakita ng kamag-anak na gastos bawat bit laban sa bilang ng mga layer. Ang bawat linya ay na-normalize sa isang solong layer ng sarili nito, hindi sa bawat isa. Ang pag-andar na nagdudulot ng graph na ito ay isinasaalang-alang ang bilang ng mga layer (y-axis), ang mabisang pagiging kumplikado ng pagdaragdag ng mga karagdagang layer, nawala ang xy na lugar dahil sa mas kumplikadong control circuitry, at ang ani ay nawala sa pamamagitan ng pagdaragdag ng higit pang mga layer. Ang paglalagay ng mga numero sa spits out isang epektibong cost-per-bit habang nagdaragdag ang mga layer.

Ngayon, ang 3D NAND ay isang napatunayan na teknolohiya. Nakita namin ang 90+ layer mula sa maramihang mga nagtitinda sa merkado, at walang sinuman ang tumatanggi na ang pagdaragdag ng mga layer ay isang epektibong paraan upang pumunta dito, dahil ang pagkawala ng lugar ay malapit sa zero at ang pagkawala ng ani ay katulad na napakababa. Ito ay dahil ang ilan sa mga hakbang na etch-and-fill sa proseso ng pagmamanupaktura ay maaaring masakop ang maraming mga layer nang sabay-sabay.

Ngunit para sa mga 3D Stacked na mga teknolohiya ng SCM, hindi pa rin namin nakita ang mga ito na lumawak nang lampas sa isang solong aparato na layer sa merkado. Ipinapakita ng data ng Kioxia na habang ang flash ng BiCS nito ay bumabawas sa isang asymptotic na halaga sa gastos bawat bit habang nakaraan kami ng 10 layer, sinabi ng kumpanya na ang 3D Stacked SCM ay pinakamahusay na mababawas lamang sa 60% ng gastos sa bawat bit para sa isang 4-5 layer ng aparato kumpara sa isang solong layer - na may pagtaas ng data mula doon. Nabababa ito sa pagtaas ng gastos sa bawat layer, kinakailangan ang pagkawala ng lugar, at ang pagbawas ng ani batay sa paggamit ng mga kumplikadong teknolohiya ng cell na walang pakinabang ng mga dekada ng mga pagpapabuti. Upang mabuo ang 3D Stacked memory, ito ay isang masakit na proseso ng layer sa layer, na humahantong sa pagbawas sa ani sa bawat karagdagang hakbang.

Para sa sinumang interesado, ang equation para sa graph na ito ay ang mga sumusunod:

Kung saan n = ang bilang ng mga layer, ang Cf ay ang gastos para sa karaniwang layer, ang Cv ay ang gastos sa bawat dagdag na layer, A ay ang parusa ng lugar para sa pagdaragdag ng isang layer, at Y ang ani na parusa para sa isang solong layer.

Kaya dapat itong ipahiwatig na sa plenary talk, hindi namin nakuha ang mga litrato ng mga slide na ipinakita. Gumawa ako ng isang mabilis na tala ng graph at ang pormula, at nag-cycled pabalik sa Kioxia na may iminungkahing mga numero para sa bawat isa sa mga variable na muling likhain ang mga graph na ito. Sumagot sila na nagsasabing malapit ako sa mga sumusunod:

Nahuhulaan na Mga Halaga ng Graph
AnandTech Cf
Karaniwang Gastos ng Layer
Cv
Dagdag na Gastos ng Layer
A
Mga pagkawala ng lugar ng Extra Layer
Y
Pagkawala ng Extra Layer
NAND 0.95 0.05 ~0 ~0
3D SCM 0.70 0.30 0.02 0.06

Kapag naglalagay ng mga numero, malinaw na ang Cf + Cv ay may pantay na 1, at bilang isang resulta kami talaga ay nagtatapos sa pagtingin sa ratio ng gastos ng pagdaragdag ng isang solong layer sa disenyo kumpara sa karaniwang layer ng isang disenyo. Ang term na kinasasangkutan ng lugar at ani ay nakakaapekto sa pagtaas ng curve, at ang ratio ng mga ito ay nagtatapos ng mahalaga para kapag ang minimum na halaga ay pati na rin ang rate kung saan ang curve ay tumataas.

Sa kaso ng 3D SCM, ang gastos bawat bit sa paligid ng 12 layer ay naging kapareho ng gastos sa bawat piraso ng isang solong layer, na nasa susi ng komentaryo ni Kioxia: kung ang SCM ay kailanman matumbok ang bilang ng mga layer na NAND flash Gusto, ito ay magiging mura na mura (50x gastos bawat isang piraso ng isang solong layer para sa isang 64-layer na SCM aparato).

Ngayon siyempre, kung kukunin natin ang panig ng mga 3D Stacked SCM vendor, malamang na ituturo nila na dahil lamang sa mga hula sa presyo ngayon ng> 4 na nakasalansan na mga layer ay tila hindi ipinagbabawal, hindi isinasaalang-alang kung ano ang mga potensyal na pagsulong mangyayari para sa teknolohiya sa hinaharap. Ang kakayahang mag-alok ng parehong high-density DRAM sa mga antas ng pagganap ng order-of-magnitude o sobrang mababang latency storage sa isang solong produkto ay nagpapahiwatig ng utility nito, sa halip na isang kakulangan ng pag-optimize para sa isa o sa iba pa.

Mula sa kung ano ang kasiyahan kong magtrabaho, nakikita ko ang pakinabang ng SCM sa puwang ng memorya - nag-aalok ng isang sobrang malaking pool ng data upang gumana mula sa isang mas mababang gastos sa bawat GB kaysa sa tradisyonal na DRAM, habang mayroon ding warranty. na sumasaklaw sa 100% na pag-access sa panahon ng warranty. Bilang isang daluyan ng imbakan, nag-aalok ito ng agarang mabilis na pag-access subalit ang gastos sa bawat GB ay sa halip mataas. Para sa imbakan ng hindi bababa sa, ang flash ay magiging hari ng kapasidad sa loob ng mahabang panahon.

Orihinal na Artikulo

Mag-iwan ng komento