W branży komputerowej od dawna żyjemy z PCIe jako standardem. Służy do dodawania dodatkowych funkcji do systemu: grafiki, pamięci masowej, portów USB, większej pamięci masowej, sieci, kart rozszerzeń, pamięci masowej, kart dźwiękowych, Wi-Fi, czy wspomniałem o pamięci masowej? Cóż, jedyną rzeczą, której nie byliśmy w stanie umieścić w gnieździe PCIe, jest DRAM - nie mam na myśli DRAM jako urządzenia magazynującego, ale pamięć, która jest faktycznie dodawana do systemu jako użyteczne DRAM. W 2019 roku wprowadzono nowy standard CXL, który wykorzystuje łącze PCIe 5.0 jako interfejs fizyczny. Częścią tego standardu jest CXL.memory - możliwość dodania pamięci DRAM do systemu poprzez gniazdo CXL / PCIe. Dzisiaj Samsung prezentuje pierwszy specjalnie zaprojektowany w ten sposób moduł DRAM.
CXL: odświeżacz
Połączenia oryginalny standard CXL rozpoczął się jako projekt badawczy w firmie Intel w celu stworzenia interfejsu, który może obsługiwać akceleratory, IO, pamięć podręczną i pamięć. Następnie przekształciła się we własne konsorcjum, z ponad 50 członkami i wsparciem kluczowych graczy w branży: Intel, AMD, Arm, IBM, Broadcom, Marvell, NVIDIA, Samsung, SK Hynix, WD i innych. Najnowszym standardem jest CXL 2.0, ukończony w listopadzie 2020 r.
Standard CXL 1.1 obejmuje trzy zestawy elementów wewnętrznych, znane jako CXL.io, CXL.memory i CXL.cache. Pozwalają one na głębszą kontrolę nad podłączonymi urządzeniami, a także rozszerzenie tego, co jest możliwe. Konsorcjum CXL widzi w tym trzy główne obszary:
Pierwszy typ to pamięć podręczna / akcelerator, taki jak silnik odciążający lub SmartNIC (inteligentny kontroler sieci). Dzięki wbudowanym funkcjom CXL.io i CXL.cache, pozwoliłoby to kontrolerowi sieciowemu sortować przychodzące dane, analizować je i filtrować to, co jest potrzebne, bezpośrednio do pamięci procesora głównego.
Drugi typ to akcelerator z pamięcią i bezpośrednim dostępem do HBM na akceleratorze z procesora (a także dostęp do DRAM z akceleratora). Pomysł polega na pseudoheterogenicznym projekcie obliczeniowym, pozwalającym na prostsze, ale bardziej rozbudowane solwery obliczeniowe.
Trzeci typ jest prawdopodobnie tym, który najbardziej nas dzisiaj interesuje: bufory pamięci. Korzystając z CXL.memory, można zainstalować bufor pamięci przez łącze CXL, a dołączoną pamięć można bezpośrednio łączyć w pule z pamięcią systemową. Pozwala to na zwiększenie przepustowości pamięci lub zwiększenie jej rozszerzenia do rzędu tysięcy gigabajtów.
CXL 2.0 wprowadza również CXL.security, obsługę pamięci trwałej i możliwości przełączania.
Należy zauważyć, że CXL używa tego samego interfejsu elektrycznego co PCIe. Oznacza to, że każde urządzenie CXL będzie miało coś, co wygląda jak fizyczne złącze PCIe. Poza tym CXL używa PCIe w swoim procesie uruchamiania, więc obecnie każde urządzenie obsługujące CXL musi również obsługiwać łącze PCIe-to-PCIe, dzięki czemu każdy kontroler CXL jest również domyślnie kontrolerem PCIe.
Jedno z częstych pytań, które widziałem, dotyczy tego, co by się stało, gdyby powstał procesor oparty tylko na CXL? Ponieważ CXL i PCIe są ze sobą powiązane, procesor nie może być tylko CXL, musiałby również obsługiwać połączenia PCIe. To powiedziawszy, z drugiej strony: jeśli na przykład zobaczymy karty graficzne oparte na CXL, musiałyby one również przynajmniej zainicjować przez PCIe, jednak pełne tryby pracy mogą nie być możliwe, jeśli CXL nie jest zainicjowany.
Intel zamierza wprowadzić CXL 1.1 w porównaniu z PCIe 5.0 z procesorami Sapphire Rapids. Microchip ogłosił Oparte na PCIe 5.0 i CXL retimery do rozszerzeń śledzenia płyt głównych. Samsung to już trzecie ogłoszenie dotyczące urządzeń obsługujących CXL. IBM ma podobną technologię zwaną OMI (OpenCAPI Memory Interface), jednak nie doczekała się szerokiego zastosowania poza własnymi procesorami IBM.
Moduł pamięci CXL firmy Samsung
Nowoczesne procesory polegają na kontrolerach pamięci w celu uzyskania dostępu do pamięci DRAM. Najwyższej klasy procesory x86 mają osiem kanałów DDR4, podczas gdy wiele akceleratorów przeszło w dół szlaku HBM. Jednym z czynników ograniczających zwiększanie przepustowości pamięci jest liczba kontrolerów, która może również ograniczać pojemność, a poza tym pamięć musi zostać zweryfikowana i przeszkolona do pracy z systemem. Większość systemów nie jest zbudowana tak, aby po prostu dodawać lub usuwać pamięć w taki sam sposób, jak można by to zrobić z urządzeniem pamięci masowej.
Wpisz CXL i możliwość dodawania pamięci jak urządzenie magazynujące. Prezentacja Samsunga dotyczy dzisiaj modułu podłączonego do CXL, maksymalnie wyposażonego w pamięć DDR5. Wykorzystuje pełne łącze PCIe 5.0 x16, pozwalające teoretycznie na dwukierunkowe 32 GT / s, ale z wieloma TB pamięci za kontrolerem bufora. Podobnie jak firmy takie jak Samsung pakują NAND do formatu U.2, z wystarczającym chłodzeniem, Samsung robi to samo tutaj, ale z pamięcią DRAM.
Pamięć DRAM jest nadal pamięcią ulotną, aw przypadku utraty zasilania dane są tracone. (Wątpię też, czy można go wymieniać na gorąco, ale zdarzały się dziwniejsze rzeczy). Można używać pamięci trwałej, ale tylko z CXL 2.0. Samsung nie stwierdził, czy ich urządzenie obsługuje CXL 2.0, ale powinno to być co najmniej CXL 1.1, ponieważ twierdzą, że obecnie jest testowane z platformą Intel Sapphire Rapids.
Należy zauważyć, że nowoczesne gniazdo DRAM jest zwykle oceniane maksymalnie na ~ 18 W. Jedynymi modułami w tym oknie zasilania są Optane DCPMM firmy Intel, ale moduł 256 GB DDR4 byłby w zakresie ~ 10 + W. W przypadku takiego dodatkowego modułu CXL o pojemności 2 TB, podejrzewam, że mamy do czynienia z około 70-80 W, więc dodanie takiej ilości pamięci DRAM przez interfejs CXL prawdopodobnie wymagałoby aktywnego chłodzenia, a także dużego radiatora, który te renderują. sugerować.
Samsung nie podaje żadnych szczegółów na temat prezentowanego modułu, poza tym, że jest oparty na CXL i ma w sobie DDR5. Nie tylko to, ale dostarczone `` zdjęcia '' wyglądają bardzo podobnie do renderowania, więc trudno jest stwierdzić, czy mają estetyczną jednostkę dostępną do fotografii, czy po prostu działa kontroler w laboratorium wychowawczym, który został sprawdzony na system. Aktualizacja: Samsung potwierdził, że są to ujęcia na żywo, a nie rendery.
W ramach ogłoszenia Samsung zacytował AMD i Intela, wskazując, z którymi partnerami ściślej współpracują, a to, co mają dzisiaj, jest sprawdzane na serwerach nowej generacji Intela. Serwery nowej generacji, Sapphire Rapids, mają zostać wprowadzone na rynek pod koniec roku, zgodnie z umową o superkomputery Aurora, która ma być początkowo dostarczona do końca roku.