การใช้สล็อต PCIe เพื่อติดตั้ง DRAM: โมดูลขยาย Samsung CXL.mem ใหม่

ในอุตสาหกรรมคอมพิวเตอร์เราใช้ PCIe เป็นมาตรฐานมานานแล้ว ใช้เพื่อเพิ่มคุณสมบัติเพิ่มเติมใด ๆ ให้กับระบบ: กราฟิกที่เก็บข้อมูลพอร์ต USB ที่เก็บข้อมูลเพิ่มเติมเครือข่ายการ์ดเสริมที่เก็บข้อมูลการ์ดเสียง Wi-Fi โอ้ฉันพูดถึงที่เก็บข้อมูลหรือไม่? สิ่งหนึ่งที่เราไม่สามารถใส่ลงในสล็อต PCIe ได้คือ DRAM - ฉันไม่ได้หมายถึง DRAM เป็นอุปกรณ์จัดเก็บข้อมูล แต่หน่วยความจำที่เพิ่มเข้ามาในระบบเป็น DRAM ที่ใช้งานได้ ย้อนกลับไปในปี 2019 มีการเปิดตัวมาตรฐาน CXL ใหม่ซึ่งใช้ลิงก์ PCIe 5.0 เป็นอินเทอร์เฟซทางกายภาพ ส่วนหนึ่งของมาตรฐานนั้นคือ CXL หน่วยความจำ - ความสามารถในการเพิ่ม DRAM ลงในระบบผ่านสล็อต CXL / PCIe วันนี้ Samsung เปิดตัวโมดูล DRAM ตัวแรกที่ออกแบบมาโดยเฉพาะในลักษณะนี้

CXL: รีเฟรช

พื้นที่ มาตรฐาน CXL เดิม เริ่มต้นจากโครงการวิจัยภายใน Intel เพื่อสร้างอินเทอร์เฟซที่รองรับตัวเร่ง, IO, แคชและหน่วยความจำ ต่อมาได้ขยายออกเป็นกลุ่มของตัวเองโดยมีสมาชิกมากกว่า 50 คนและได้รับการสนับสนุนจากผู้เล่นหลักในอุตสาหกรรม: Intel, AMD, Arm, IBM, Broadcom, Marvell, NVIDIA, Samsung, SK Hynix, WD และอื่น ๆ มาตรฐานล่าสุดคือ CXL 2.0 ซึ่งสรุปในเดือนพฤศจิกายน 2020

อ่านเพิ่มเติม

มาตรฐาน CXL 1.1 ครอบคลุมเนื้อหาภายในสามชุดซึ่งเรียกว่า CXL.io, CXL.memory และ CXL.cache สิ่งเหล่านี้ช่วยให้สามารถควบคุมอุปกรณ์ที่เชื่อมต่อได้ลึกขึ้นรวมถึงการขยายสิ่งที่เป็นไปได้ กลุ่ม CXL มองเห็นสามประเด็นหลักสำหรับสิ่งนี้:

CXL202.020Press20Briefing20Deck คว่ำบาตร หน้า 005 575px 1

ประเภทแรกคือแคช / ตัวเร่งความเร็วเช่น offload engine หรือ SmartNIC (ตัวควบคุมเครือข่ายอัจฉริยะ) ด้วย CXL.io และ CXL.cache intrinsics สิ่งนี้จะช่วยให้ตัวควบคุมเครือข่ายสามารถจัดเรียงข้อมูลขาเข้าวิเคราะห์และกรองสิ่งที่จำเป็นโดยตรงลงในหน่วยความจำโปรเซสเซอร์หลัก

ประเภทที่สองคือตัวเร่งความเร็วที่มีหน่วยความจำและเข้าถึง HBM โดยตรงบนตัวเร่งความเร็วจากโปรเซสเซอร์ (เช่นเดียวกับการเข้าถึง DRAM จากตัวเร่งความเร็ว) แนวคิดนี้เป็นการออกแบบการคำนวณแบบหลอกที่แตกต่างกันซึ่งช่วยให้สามารถแก้ปัญหาการคำนวณที่ง่ายกว่า แต่มีความหนาแน่นสูง

ประเภทที่สามอาจเป็นประเภทที่เราสนใจมากที่สุดในปัจจุบัน: บัฟเฟอร์หน่วยความจำ การใช้หน่วยความจำ CXL สามารถติดตั้งบัฟเฟอร์หน่วยความจำผ่านลิงก์ CXL และหน่วยความจำที่เชื่อมต่อสามารถรวมเข้ากับหน่วยความจำระบบได้โดยตรง ซึ่งจะช่วยให้เพิ่มแบนด์วิดท์หน่วยความจำหรือเพิ่มการขยายหน่วยความจำได้ตามลำดับหลายพันกิกะไบต์

CXL 2.0 ยังแนะนำ CXL ความปลอดภัยการสนับสนุนหน่วยความจำถาวรและความสามารถในการสลับ

ควรสังเกตว่า CXL ใช้อินเทอร์เฟซทางไฟฟ้าเดียวกันกับ PCIe นั่นหมายความว่าอุปกรณ์ CXL ใด ๆ จะมีสิ่งที่ดูเหมือนขั้วต่อฟิสิคัล PCIe นอกเหนือจากนั้น CXL ยังใช้ PCIe ในกระบวนการเริ่มต้นดังนั้นในปัจจุบันอุปกรณ์ที่รองรับ CXL จะต้องรองรับการเชื่อมโยง PCIe-to-PCIe ด้วยทำให้คอนโทรลเลอร์ CXL เป็นคอนโทรลเลอร์ PCIe ตามค่าเริ่มต้น

คำถามทั่วไปอย่างหนึ่งที่ฉันเคยเห็นคือจะเกิดอะไรขึ้นถ้าซีพียูแบบ CXL เท่านั้น? เนื่องจาก CXL และ PCIe เชื่อมต่อกันซีพียูจึงไม่สามารถเป็น CXL อย่างเดียวได้จึงต้องรองรับการเชื่อมต่อ PCIe ด้วย ดังที่กล่าวมาจากทิศทางอื่น: หากเราเห็นการ์ดกราฟิกที่ใช้ CXL เช่นอย่างน้อยพวกเขาจะต้องเริ่มต้นด้วย PCIe เป็นอย่างน้อยอย่างไรก็ตามโหมดการทำงานเต็มรูปแบบอาจไม่สามารถทำได้หากไม่ได้เริ่มต้น CXL

Intel ได้รับการตั้งค่าให้แนะนำ CXL 1.1 บน PCIe 5.0 พร้อมด้วยโปรเซสเซอร์ Sapphire Rapids ไมโครชิพได้ประกาศ รีไทม์เมอร์ที่ใช้ PCIe 5.0 และ CXL สำหรับส่วนขยายการติดตามเมนบอร์ด วันนี้ Samsung เป็นการประกาศครั้งที่สามสำหรับอุปกรณ์ที่รองรับ CXL IBM มีเทคโนโลยีที่คล้ายกันที่เรียกว่า OMI (OpenCAPI Memory Interface) อย่างไรก็ตามยังไม่เห็นการนำไปใช้อย่างกว้างขวางนอกโปรเซสเซอร์ของ IBM เอง

โมดูลหน่วยความจำ CXL ของ Samsung

โปรเซสเซอร์สมัยใหม่ใช้ตัวควบคุมหน่วยความจำสำหรับการเข้าถึง DRAM ที่แนบมา โปรเซสเซอร์ x86 อันดับต้น ๆ มีแปดแชนเนลของ DDR4 ในขณะที่ตัวเร่งความเร็วจำนวนหนึ่งได้ไปตามเส้นทาง HBM หนึ่งในปัจจัยที่ จำกัด ในการขยายแบนด์วิดท์หน่วยความจำคือจำนวนคอนโทรลเลอร์ซึ่งสามารถจำกัดความจุได้เช่นกันและนอกจากนี้หน่วยความจำนั้นจำเป็นต้องได้รับการตรวจสอบและฝึกอบรมเพื่อให้ทำงานกับระบบได้ ระบบส่วนใหญ่ไม่ได้สร้างขึ้นเพื่อเพิ่มหรือลบหน่วยความจำแบบเดียวกับที่คุณทำกับอุปกรณ์จัดเก็บข้อมูล

ป้อน CXL และความสามารถในการเพิ่มหน่วยความจำเช่นอุปกรณ์จัดเก็บข้อมูล การเปิดตัวของ Samsung ในวันนี้เป็นโมดูลที่ต่อ CXL ที่อัดแน่นไปด้วย DDR5 สูงสุด ใช้ลิงก์ PCIe 5.0 x16 เต็มรูปแบบทำให้สามารถใช้ 32 GT / s แบบสองทิศทางตามทฤษฎี แต่มีหน่วยความจำหลาย TB อยู่หลังตัวควบคุมบัฟเฟอร์ ในลักษณะเดียวกับที่ บริษัท ต่างๆเช่น Samsung บรรจุ NAND ลงในฟอร์มแฟคเตอร์ขนาด U.2 โดยมีการระบายความร้อนที่เพียงพอ Samsung ก็ทำเช่นเดียวกันกับ DRAM

DRAM ยังคงเป็นหน่วยความจำที่ลบเลือนและข้อมูลจะหายไปหากพลังงานสูญหาย (ฉันสงสัยว่ามันร้อนแบบถอดเปลี่ยนได้เช่นกัน แต่สิ่งที่แปลกประหลาดได้เกิดขึ้น) สามารถใช้หน่วยความจำถาวรได้ แต่เฉพาะกับ CXL 2.0 ซัมซุงไม่ได้ระบุว่าอุปกรณ์ของพวกเขารองรับ CXL 2.0 หรือไม่ แต่ควรมีอย่างน้อย CXL 1.1 ตามที่ระบุว่ากำลังทดสอบกับแพลตฟอร์ม Sapphire Rapids ของ Intel

ควรสังเกตว่าสล็อต DRAM สมัยใหม่มักจะได้รับการจัดอันดับสูงสุดที่ ~ 18W โมดูลเดียวในหน้าต่างไฟฟ้านั้นคือ Optane DCPMM ของ Intel แต่โมดูล 256 GB DDR4 จะอยู่ในช่วง ~ 10 + W สำหรับโมดูล CXL เพิ่มเติม 2 TB เช่นนี้ฉันสงสัยว่าเรากำลังดูที่ประมาณ 70-80 W ดังนั้นการเพิ่ม DRAM จำนวนนั้นผ่านอินเทอร์เฟซ CXL น่าจะต้องการการระบายความร้อนที่ใช้งานอยู่เช่นเดียวกับฮีทซิงค์ขนาดใหญ่ที่แสดงผลเหล่านี้ แนะนำ.

ซัมซุงไม่ได้ให้รายละเอียดใด ๆ เกี่ยวกับโมดูลที่พวกเขาเปิดตัวยกเว้นว่าเป็นแบบ CXL และมี DDR5 อยู่ ไม่เพียงแค่นั้น แต่ 'ภาพถ่าย' ที่ให้มานั้นมีลักษณะเหมือนการแสดงผลมากดังนั้นจึงยากที่จะระบุว่ามีหน่วยความงามสำหรับการถ่ายภาพหรือไม่หรือมีเพียงแค่ตัวควบคุมการทำงานในห้องปฏิบัติการแสดงที่ใดที่หนึ่งซึ่งได้รับการตรวจสอบแล้ว ระบบ อัปเดต: Samsung ยืนยันว่าสิ่งเหล่านี้เป็นภาพสดไม่ใช่การแสดงผล

ในฐานะที่เป็นส่วนหนึ่งของการประกาศ Samsung อ้างคำพูดของ AMD และ Intel ซึ่งระบุว่าพันธมิตรใดที่พวกเขาทำงานอย่างใกล้ชิดมากขึ้นและสิ่งที่พวกเขามีอยู่ในวันนี้กำลังได้รับการตรวจสอบความถูกต้องบนเซิร์ฟเวอร์รุ่นต่อไปของ Intel เซิร์ฟเวอร์รุ่นต่อไปของ Intel แซฟไฟร์แรพิดส์มีกำหนดเปิดตัวในช่วงปลายปีนี้ซึ่งสอดคล้องกับสัญญาซูเปอร์คอมพิวเตอร์ของ Aurora ที่กำหนดไว้ว่าจะจัดส่งในตอนแรกภายในสิ้นปีนี้

บทความต้นฉบับ

โพสต์ที่เกี่ยวข้อง