Síť Microsoft Azure se zrychluje díky vlastnímu hardwaru

Vytváření sítí mezi virtuálními počítači v Microsoft Azure se díky novému hardwaru, který společnost Microsoft zavedla v rámci svých datových center, dostane mnohem rychleji.

Společnost oznámila v pondělí, že má k dispozici stovky tisíc FPGA (Field-Programmable Gate Arrays) napříč servery v zemích 15 a pěti různých kontinentech. Tyto čipy byly využity v řadě služeb první strany společnosti Microsoft a nyní začínají urychlit vytváření sítí na platformě Azure cloud společnosti.

Kromě zlepšení síťových rychlostí mohou být FPGA (které sedí na zakázku, desky navržené společností Microsoft připojené k serverům Azure) také použity ke zlepšení rychlosti úloh strojového učení a dalších klíčových funkcí cloudu. Microsoft neřekl přesně, co obsah desek zahrnuje, kromě odhalení, že mají FPGA, statické RAM čipy a kalené procesory digitálního signálu.

Nasazení programovatelného hardwaru společnosti Microsoft je důležité, protože předchozí spolehlivé zvýšení rychlosti procesoru se nadále zpomaluje. FPGA mohou poskytnout další zvýšení rychlosti zpracování výkonu pro konkrétní úkoly, které byly nakonfigurovány pro práci, snížení času potřebného k provádění věcí, jako je řízení toku síťového provozu nebo překládání textu.

S Microsoftem, který se snaží vytlačit každou unci síly z výpočetního hardwaru a stopu, kterou již musí konkurovat ostatním hráčům na cloudovém trhu, by tento hardware mohl společnosti poskytnout výhodu.

Zrychlená síť, nová funkce dostupná v beta verzi v pondělí, je jedním z příkladů funkcí, které umožňuje implementace FPGA. Mezi dvěma virtuálními stroji, které mají oba povoleny, umožní uživatelům rychlost až 25Gbps a latenci přibližně 100 mikrosekund, bez dodatečných poplatků.

Oznámení Accelerated Networking přichází jen týden poté, co společnost Oracle představila svou druhou generaci infrastruktury jako služby v rámci OpenWorld, která obsahuje také off-serverové softwarově definované sítě, které umožňují lepší výkon.

Azure CTO Mark Russinovich řekl, že použití FPGA bylo klíčem k tomu, aby Azure využil síťového hardwaru, který vložil do svých datových center. Zatímco hardware by mohl podporovat rychlost 40Gbps, vlastně pohybující se celým tímto síťovým provozem s různými softwarově definovanými síťovými pravidly, která jsou k němu připojena, si vyžádala obrovské množství výkonu procesoru.

"To prostě není ekonomicky životaschopné," řekl v rozhovoru. „Proč tyto procesory odtrhnout od toho, co můžeme prodávat zákazníkům ve virtuálních strojích, když bychom mohli mít toto zařízení nahrané do FPGA? Mohou sloužit tomuto účelu i budoucím účelům a seznámit se s FPGA v našem datovém centru. Stalo se to pro nás docela jasnou výhrou. “

Projekt je základem Doug Burger, významného inženýra ve skupině Microsoft Research's New Experiences and Technologies (NExT). Burger zahájil v 2010 projekt FPGA s kódovým označením Catapult. Tým nejprve začal pracovat s Bingem a poté expandoval do Azure. Tato práce vedla k druhému současnému návrhu hardwarového uspořádání FPGA od společnosti Microsoft.

Každému novému serveru Azure je přiřazena jedna FPGA karta a je připojena k NIC (karta síťového rozhraní), sběrnici PCIe a síťovému přepínači nahoře. To znamená, že je možné, aby každý FPGA mluvil s ostatními, a Microsoft může využít velké FPGA napříč svými datovými centry pro velké úlohy s nízkou latencí. To je důležité zejména pro masivní aplikace strojového učení.

"Pokud chceme přidělit 1,000 FPGA do jediné [hluboké neuronové sítě], můžeme," řekl Burger. "Dostáváme takový rozsah."

Toto měřítko může poskytnout obrovské množství výpočetního výkonu. Kdyby Microsoft použil Azureho nasazení celého FPGA k překladu Wikipedie v anglickém jazyce, trvalo by to jen desetinu vteřiny, řekl Burger na jevišti na Ignite.

Microsoft není jedinou společností, která se na tento druh práce obrací na vlastní křemík. Společnost Google představila na začátku letošního roku Tensor Processing Unit, která by měla urychlit některé úlohy strojového učení ve svém cloudu. TPU je aplikačně specifický integrovaný obvod nebo ASIC - účelový čip.

Google použil ASIC místo FPGA kvůli rychlosti a efektivnosti. Proč si tedy Microsoft vybral FPGA?

Průmysl se pohybuje příliš rychle pro něj, aby byl jistý, že konkrétní ASIC udělá, co je třeba udělat v průběhu času, řekl Burger. Zatímco použití pouze přeprogramovatelného hardwaru v FPGA by nebylo skvělé pro výkon, zpevněné čipy SRAM a DSP na desce FPGA mohou urychlit určité aplikace a zmenšovat tak výkonnostní mezeru.

„Nejsem spokojen s uzamčením kontrolní cesty na tři roky a říkám:„ Vím, co mám dělat, “řekl Burger.

V současné době je služba Accelerated Networking k dispozici pouze pro instance DS15v2 v regionech Azure's West Central USA a Western Europe. Je kompatibilní pouze se systémem Windows Server 2012 R2 a technickým náhledem 2016 systému Windows Server 5, i když společnost Microsoft plánuje, že bude brzy fungovat s instancemi Linuxu.

Služba Accelerated Networking se v budoucnu rozšíří na další typy virtuálních počítačů a operační systémy Azure. To půjde od bytí opt-in vylepšení k bytí volný, opt-out výhoda, která zvýší síťové rychlosti dostupné standardně.

Když se podíváme do budoucna, Microsoft uvedl, že FPGA budou použity v aplikacích strojového učení. Burger uvedl, že společnost nastavila kód pro své kognitivní služby, aby mohla běžet v režimu s akcelerací FPGA, takže mohou být další.

„Bude to cesta, jak tuto schopnost vystavujeme zákazníkům,“ řekl Russinovič. „Myslím, že první věc, o které hovoříme, je [hluboké učení], kde trénujeme modely a pak je necháváme zákazníky provozovat na CPU nebo GPU v našem datovém centru. V budoucnu budou mít možnost provozovat bodování na FPGA a potenciálně i samotné modely vlaků, pokud chtějí na FPGA. Ale máme cesty pryč. “

Pro Burger bude jednou z největších otázek to, co je správná kombinace FPGA a CPU uvnitř datového centra Azure. Přestože Microsoft má stovky tisíc FPGA, které již byly nasazeny, nestačí k uspokojení potřeb společnosti, protože je používá více týmů.

„CPU jsou důležité a budou i nadále důležité pro veškerý software a všechny tyto produkty a služby, které máme,“ řekl. „Ale myslím, že pro aplikace bude velký průlom v měřítku pocházet z technologií bez CPU.“

Zdroj

Napsat komentář