Nové grafické procesory GPU společnosti Nvidia mohou poskytnout inteligentní odpovědi

Autonomní vozy potřebují nový druh koňské síly k identifikaci objektů, vyhýbání se překážkám a změně jízdních pruhů. Existuje velká šance, že to bude pocházet z grafických procesorů v datových centrech nebo dokonce od kmenů automobilů.

S ohledem na tento scénář vytvořila společnost Nvidia dvě nové GPU - Tesla P4 a P40 - založené na architektuře Pascal a navržené pro servery nebo počítače, které pomáhají řídit autonomní automobily. V posledních letech byly grafické procesory Tesla zaměřeny na superpočítače, ale nyní se vylepšují pro systémy hlubokého učení, které pomáhají při korelaci a klasifikaci dat.

"Hluboké učení" obvykle odkazuje na třídu algoritmických technik založených na vysoce propojených neuronových sítích - systémech uzlů s váženými propojenostmi mezi nimi.

Je to všechno součást obecného trendu: jak více dat je přenášeno do mraku prostřednictvím nejrůznějších systémů a zařízení, prochází hlubokými učebními systémy pro odpovědi, kontext a vhledy.

Například Facebook a Google vytvořily systémy pro hluboké učení kolem GPU pro rozpoznávání obrazu a zpracování přirozeného jazyka. Mezitím Nvidia říká, že Baidu je Deep Speech 2 rozpoznávání řeči platforma je postavena kolem jeho Tesla GPUs.

Nové Teslas mají výkon, aby byly pravidelné GPU. P40 má jádra 3,840 CUDA, nabízí 12 teraflops s jednorozměrovým výkonem, paměť 24GB paměti GDDR5 a čerpání 250 wattů. P4 má jádra 2,560, poskytuje 5.5 teraflops s jednoznačným výkonem, má 8GB paměti GDDR5 a čerpá až do výkonu 75 wattů.

Další funkce hlubokého učení byly na grafických jednotkách. Spektrální GPU se obvykle vyznačují dvojnásobnou přesností pro přesnější výpočty, ale nový Teslas také zpracovává výpočty na nízké úrovni. Každé jádro zpracovává množství informací; tyto bloky dat mohou být spojeny dohromady za účelem interpretace informací a odvozování odpovědí na otázky, například o tom, jaké objekty jsou obsaženy v obrázcích nebo jaké slova mluví lidé, kteří si mezi sebou mluví.

Systémy hlubokého učení se spoléhají na takové výpočty na nízké úrovni, které se týkají inferencí, protože výpočty s dvojitou přesností, které by přinesly přesnější výsledky, ale vyžadují větší výpočetní výkon, by zpomalily GPU.

Nvidia uvedla v loňském roce Tesla P100, který je rychlejší než nadcházející modely P4 a P40. P100 je určen pro high-end servery a používá se pro jemné doladění neuronových sítí s hlubokým učením.

Nové grafické procesory Tesla P4 a P40 mají zpracování pro celé hloubkové zpracování s plovoucím bodem a nízké hladiny pro hluboké učení a mohou být také použity pro inferenci a aproximaci na místní úrovni. Myšlenka spočívá v tom, že některé typy systémů a automobilů nemohou být vždy spojeny s mrakem a budou muset zpracovávat lokálně.

Nízkoúrovňové zpracování pro přiblížení je také přidáván Intel k jeho nadcházejícímu čipu Knights Mill, který je také navržen pro hluboké učení.

Tesla P4 a P40 mají úspěch v produktech Tesla M4 a M40, které byly vydány minulý rok pro grafické zpracování a virtualizaci. Nové GPU budou moci tyto věci dělat také.

Tesla P40 bude dodávat v říjnu, zatímco P4 bude v listopadu vydáno. GPU budou k dispozici na serverech od společností Dell, Hewlett Packard Enterprise, Lenovo, Quanta, Wistron, Inventec a Inspur. Dodavatelé serverů rozhodnou o ceně GPU.

Zdroj

Napsat komentář