ARM Umum IP Belajar Mesin Trillium Projek

Pengumuman Lengan Hari ini sedikit keluar dari norma untuk syarikat itu, kerana ia adalah yang pertama dalam satu siri maklumat terbitan berperingkat. Untuk Pengumuman pertama ini Lengan secara terbuka memperkenalkan "Project Trillium" - sekumpulan penyelesaian perisian serta IP untuk pengesanan objek dan pembelajaran mesin.

Pembelajaran mesin memang yang topik baru yang hangat dalam perniagaan semikonduktor dan secara khususnya telah melihat tumpuan besar di dunia mudah alih sejak beberapa bulan terakhir, dengan pengumuman dari pelbagai syarikat IP serta penyelesaian pengguna dari orang-orang seperti Huawei. Kami baru-baru ini mempunyai paparan yang lebih mendalam dan penerokaan topik mesin pembelajaran dan pemprosesan rangkaian saraf dalam a seksyen yang berdedikasi daripada kami kajian Kirin 970.

Walaupun kami mempunyai banyak bunyi dari banyak pemain industri mengenai topik IP pembelajaran mesin. Lengan tidak dapat dilihat dari berita dan sehingga kini fokusnya adalah pada sambungan ISA CPU Armv8.2, yang memperkenalkan arahan khusus yang memudahkan dan mempercepatkan pelaksanaan rangkaian saraf dengan bantuan titik terapung setengah tepat dan produk integer dot.

Di samping penambahbaikan CPU, kami juga melihat peningkatan GPU untuk pembelajaran mesin di G72. Walaupun kedua-dua penambahbaikan ini membantu, mereka tidak mencukupi dalam penggunaan-kes di mana prestasi maksimum dan kecekapan diperlukan. Sebagai contoh, seperti yang kita lihat dalam ujian NPIN Kirin 970 dan DSP Qualcomm - kecekapan pelaksanaan inferens pada IP khusus adalah di atas perintah magnitud yang lebih tinggi daripada menjalankannya pada CPU.

Seperti yang dinyatakan oleh Arm, pembaikan Armv8.2 dan GPU hanya merupakan hasil pertama ke arah mewujudkan penyelesaian untuk pembelajaran mesin, sementara selari mereka telah mengkaji keperluan penyelesaian khusus. Tekanan industri dari rakan kongsi menyatakan dengan jelas bahawa keperluan prestasi dan kecekapan menjadikan penyelesaian berdedikasi tidak dapat dielakkan dan mula bekerja pada pemproses pembelajaran komputer (ML).

Pengumuman hari ini meliputi pemproses ML baru serta pemproses pengesanan objek (OD). IP yang kedua adalah hasil dari Arm Pengambilalihan Apical di 2016 yang menyaksikan syarikat itu menambah penyelesaian untuk paparan dan saluran paip kamera ke portfolio IP mereka.

Bermula dengan pemproses ML - apa yang kita bicarakan di sini adalah IP berdedikasi bagi model rangkaian neural yang memprediksi percepatan. Seperti yang telah kami tegaskan dalam pengumuman berkaitan NN kami lewat, Lengan juga menekankan bahawa memiliki senibina yang direka khusus untuk beban kerja tersebut boleh mempunyai kelebihan yang signifikan berbanding dengan seni bina tradisional dan GPU. Lengan juga memberi tumpuan besar kepada keperluan untuk mereka bentuk seni bina yang mampu melakukan pengurusan memori optimum data yang mengalir melalui pemproses apabila melaksanakan beban kerja ML. Beban kerja ini mempunyai kebolehgunaan semula data yang tinggi dan meminimumkan data dalam dan luar melalui prosesor merupakan aspek utama untuk mencapai prestasi tinggi dan kecekapan yang tinggi.

Pemproses lengan ML menjanjikan mencapai pencapaian teori lebih dari 4.6TOPs (integer bit 8) pada sampul kuasa sasaran sekitar 1.5W, pengiklanan sehingga 3TOPs / W. Anggaran kuasa dan kecekapan didasarkan pada pelaksanaan IP 7nm.

Berkenaan dengan angka prestasi, Arm bersetuju dengan saya bahawa angka TOPs sahaja mungkin bukan angka terbaik untuk mewakili prestasi IP; Walau bagaimanapun ia masih berguna sehinggalah industri boleh bekerja ke arah beberapa jenis standardisasi untuk menanda aras pada model rangkaian saraf yang popular. Pemproses ML boleh bertindak sebagai blok IP sepenuhnya berdedikasi dan berdiri sendiri dengan antara muka ACE-Lite sendiri untuk dimasukkan ke dalam SoC, atau ia boleh digabungkan dalam cluster DynamiQ, yang lebih banyak dari segi pelaksanaan. Lengan tidak bersedia untuk mendedahkan lebih banyak maklumat arkitek pemproses dan rizab yang untuk pengumuman masa depan.

Aspek yang sepatutnya mengelirukan adalah penamaan Arm pada IP baru. Sesungguhnya Lengan tidak menyedari bahawa istilah "pemecut" adalah sesuai di sini kerana pemecut tradisional untuk Lengan bermaksud perkara-perkara seperti pengendali pengendali paket dalam ruang rangkaian. Sebaliknya Lengan melihat pemproses ML baru sebagai pemproses yang lebih lengkap dan dengan itu layak penamaan itu.

Pemproses OD adalah pemproses wawasan yang lebih tradisional dan dioptimumkan untuk tugas pengesanan objek. Masih terdapat keperluan bagi IP tersebut sementara pemproses ML boleh melakukan tugas yang sama melalui rangkaian saraf, pemproses OD dapat melakukannya dengan lebih cepat dan lebih efisien. Ini memaparkan sejauh mana industri akan membuat IP berdedikasi untuk tugas-tugas yang sangat khusus untuk dapat mengekstrak jumlah maksimum kecekapan.

Lengan membayangkan penggunaan-kes di mana pemproses OD dan ML disatukan bersama-sama, di mana pemproses OD akan mengasingkan kawasan kepentingan dalam imej dan meneruskannya ke pemproses ML di mana pemprosesan lebih halus dijalankan. Lengan mempunyai contoh menyenangkan sebagai idea, tetapi terus terang kita masih tidak tahu pasti bagaimana kes-kes penggunaan dalam ruang mudah alih akan berubah. Perkara yang sama tidak boleh dikatakan mengenai sistem kamera dan pengawasan di mana kita melihat peluang dan keperluan penggunaan berterusan pemprosesan OD dan ML.

Pemproses ML generasi pertama yang disasarkan pada penggunaan mudah alih manakala varian untuk ruang lain akan diikuti pada masa akan datang. Senibina IP dikatakan berskala baik ke atas dan ke bawah dari pelepas mudah alih awal.

Sebagai sebahagian daripada Trillium Projek, Lengan juga menyediakan sejumlah besar perisian yang akan membantu pemaju melaksanakan model rangkaian saraf mereka ke dalam rangka kerja NN yang berbeza. Ini akan tersedia mulai hari ini di laman web pemaju Arm dan juga Github.

Pemproses OD disasarkan untuk dibebaskan kepada rakan kongsi di Q1 sementara pemproses ML dikatakan siap pada pertengahan 2018. Sekali lagi ini sangat luar biasa untuk Lengan kerana biasanya pengumuman umum berlaku jauh selepas ketersediaan IP kepada pelanggan. Oleh kerana sifat pembangunan SoC, kita tidak sepatutnya mengharapkan silikon berdasarkan IP baru sehingga pertengahan hingga lewat 2019 pada awalnya, menjadikan Lengan sebagai salah satu pelambat yang lambat di kalangan vendor IP semikonduktor yang menawarkan ML IP.

Artikel Asal

Sebarkan cinta

Sila tinggalkan balasan anda

Alamat email anda tidak akan disiarkan. Ruangan yang diperlukan ditanda *