Mobile

Le programme de processeur personnalisé Cortex-X d'ARM pourrait enfin rendre les performances phares d'Android compétitives avec Apple

Chaque année en mai, ARM, basée au Royaume-Uni, appartenant à Softbank, basée au Japon, annonce sa nouvelle adresse IP mobile (propriété intellectuelle) destinée aux appareils mobiles. Cette adresse IP se compose de nouveaux cœurs de processeur ainsi que de nouveaux GPU. L'ensemble d'instructions d'ARM est utilisé dans tous les smartphones du monde - c'est une entreprise d'une importance cruciale. En termes d'architectures de cœur de processeur, à partir de 2021, tous les principaux fournisseurs de puces mobiles utiliseront l'adresse IP du processeur d'origine d'ARM (comme Samsung System LSI a laissé tomber sur ses cœurs personnalisés Exynos M). C'est pourquoi, il est doublement important que ARM fasse les choses correctement. Cette année, ARM a annoncé l'architecture CPU ARM Cortex-A78 et le GPU Mali-G78, les successeurs du Cortex-A77 CPU et le Mali-G77 GPU respectivement. Alors que ces annonces étaient attendues, ce qui n'était pas prévu était que ARM annonce un autre cœur de processeur. Pendant des années, les critiques techniques et les utilisateurs ont déploré le fait que les architectures de processeur d'Apple ont plusieurs années d'avance sur la série Cortex-A d'ARM. Avec le programme CPU Cortex-X et le Cortex-X1, cela pourrait enfin changer en 2021.

ARM sait que ses clients exigent plus de solutions et de produits en fonction de besoins différents dans différents segments de produits. le Cortex-A76, par exemple, est utilisé dans les SoC phares ainsi que dans certains SoC de milieu de gamme inférieur. Ses performances maximales n'étaient pas aussi élevées que celles des concurrents d'Apple car ARM devait d'abord se concentrer sur le PPA (performances, puissance et surface). L'efficacité énergétique et l'efficacité énergétique étaient des priorités plus élevées pour l'entreprise au lieu de la performance absolue.

Avec le Cortex-X1, cela change.

ARM a annoncé le programme Cortex-X Custom (CXC). Ce programme implique une collaboration étroite avec les équipes d'ingénierie ARM et les partenaires du programme ARM, qui peuvent façonner un produit CPU final pour répondre à leurs demandes spécifiques du marché. ARM note que cela permet aux partenaires du programme de définir leurs propres points de performance en dehors de «l'enveloppe Cortex-A habituelle du PPA». Le processeur personnalisé final, conçu et construit par ARM, sera livré sous la marque ARM Cortex-X. Le premier processeur faisant partie du programme CXC est le processeur ARM Cortex-X1.

ARM est très fier du Cortex-X1, affirmant qu'il s'agit du processeur Cortex le plus puissant à ce jour. Il apporte une amélioration des performances de pointe de 30% par rapport au Cortex-A77 actuel. On dit qu'il apporte des «performances ultimes» aux solutions personnalisées de nouvelle génération. Le CPU est venu en réponse aux partenaires qui voulaient maximiser les performances en fonction de leurs propres cas d'utilisation.

Le Cortex-X1, comme prévu, est également plus rapide que le Cortex-A78 nouvellement annoncé, qui se trouve en dessous. Le libellé est important ici. ARM dit qu'il fournit amélioration des performances par rapport au Cortex-A78 avec jusqu'à 22% d'améliorations des performances entières à un seul thread. Les «hausses» se réfèrent au fait que les améliorations sont liées à de courtes rafales de haute performance, qui sont les meilleures pour la réactivité et la réactivité, selon ARM. Cela permettra supposément les performances les plus élevées jamais vues pour les smartphones et les appareils grand écran, mais en raison des chiffres, le Cortex-X1 ne pourra toujours pas égaler le prochain Apple A14, avec lequel il sera en concurrence. Il pourrait cependant être en mesure de marquer un score comparable à celui de l'Apple A2019 de 13.

Le Cortex-X1 offre 2x améliorations de performances d'apprentissage automatique (ML) par rapport à l'A77. Il s'agit d'une amélioration notable, qui s'inscrit dans le cadre de la poussée plus large d'ARM pour des performances de calcul plus locales.

Le cluster DynamIQ de 4x cœurs Cortex-A78 et 4x Cortex-A55 offre des améliorations de performances durables de 20% par rapport au cluster 4x Cortex-A77 et 4x Cortex-A55. Pour plus d'informations sur la réclamation de 20%, consultez notre article. (Oui, ARM n'a malheureusement pas annoncé un successeur au Cortex-A55, malheureusement. Cela pourrait venir l'année prochaine.) Le Cortex-X1, en revanche, permet une plus grande évolutivité tout en augmentant les performances de pointe. Les partenaires qui ajoutent 1x Cortex-X1 dans le cadre du cluster DynamIQ aux côtés de 3x Cortex-A8 et 4x Cortex-A55 obtiendront une amélioration de 30% de leurs performances de pointe par rapport à la génération précédente, ce qui est un exploit à noter. L'A78 est spécialement conçu pour l'efficacité, donc lorsqu'il est combiné avec le Cortex-X1, le combo offrira les meilleures performances soutenues et maximales. Les téléphones Android phares seront beaucoup plus rapides.

ARM affirme que le marché clé pour les solutions avec le Cortex-X1 sont les smartphones et les nouveaux facteurs de forme (téléphones pliables et grands appareils multi-écrans). Le X1 offre une expérience utilisateur plus rapide avec des temps de chargement des applications plus rapides et une meilleure réactivité du défilement des pages Web. Les expériences basées sur l'IA et le ML s'amélioreront avec l'amélioration des performances du ML. Le X1 améliorera également, de manière prévisible, des cas d'utilisation tels que la productivité, la communication, la sécurité, l'immersion numérique multiple, les expériences de jeu avancées et XR basées sur la caméra.

ARM Cortex-X1 - Architecture du processeur

L'architecture du Cortex-X1 est l'endroit où les choses deviennent intéressantes. Il a de nombreuses mises à niveau microarchitecturales qui fournissent cette augmentation de performances de pointe. Le Cortex-A76, qui a été annoncé en 2018, a mis à niveau la largeur de décodage des instructions à 4 de largeur par rapport à la largeur 3 du Cortex-A75, qui, à son tour, était passée de la largeur 2 largeur du Cortex-A73. Cependant, le Cortex-A77 a choisi de maintenir la largeur de décodage constante à 4 de large. Les puces de la série A d'Apple sont grandes et larges, car la largeur de décodage de toutes les puces de la série A depuis l'A11 a été de 7, ce qui est plus large que même les architectures de processeur de bureau. ARM a fait un pas de plus vers Apple avec le Cortex-X1, car la bande passante de décodage a été augmentée de 25% à 5 instructions décodées par cycle.

De plus, ARM indique que le débit du cache MOP a été augmenté de 33% à 8 MOP par cycle. Le moteur Neon du Cortex-X1 reçoit deux tuyaux supplémentaires qui doublent sa capacité de calcul par rapport à l'A78. En termes de tailles de cache, le X1 prend en charge 64 Ko L1 et jusqu'à 1 Mo de cache L2, tandis que le cluster DynamIQ a été mis à niveau pour prendre désormais en charge 8 Mo de L3 pour des performances optimales. Le plus grand L3 peut également être utilisé par l'A78 lorsqu'il est utilisé en combinaison avec le Cortex-X1.

Le Cortex-X1 est le premier exemple d'un processeur Cortex produit dans le cadre du programme CXC. Le besoin même du programme CXC est de pousser les performances à une enveloppe en dehors du PPA Cortex-A. En effet, toutes ces performances accrues ont un coût. Le Cortex-X1 mesure 1.5 fois la taille du Cortex-A78. Cela signifie qu'il a un PPA pire ainsi qu'une plus mauvaise efficacité énergétique. Il est donc peu probable qu'il se trouve dans un téléphone de milieu de gamme ou à petit budget, car il sera probablement limité aux téléphones phares haut de gamme. Permettre aux partenaires de disposer d'un processeur spécifique à leur besoin du marché différenciera la feuille de route des processeurs Cortex-A. Il convient de noter ici que les partenaires du programme ne seront pas en mesure de personnaliser directement une CPU sous le programme CXC. Au lieu de cela, le programme CXC est essentiellement le successeur de la licence «Built for Cortex», où ARM apporte des modifications à la demande des partenaires et conçoit l'IP du processeur à vendre au partenaire. De cette façon, ARM dit qu'il répondra aux besoins de l'écosystème en constante expansion.

La vitesse d'horloge cible du Cortex-X1 est de 3 GHz. ARM cible le 3GHz depuis l'A76, et la vitesse d'horloge ne s'est notamment pas matérialisée. Cependant, avec l'avènement prochain des SoC 5 nm, ARM espère que les fournisseurs proposeront enfin le gros cœur d'ARM à 3 GHz. ARM note que toutes les estimations de performance étaient basées sur SPECint2006, qui est une référence standard de l'industrie.

Outlook

L'annonce du Cortex-X1 est passionnante pour les acheteurs en herbe de téléphones Android phares en 2021. Pour la première fois depuis 2013 et l'Apple A7, ARM pourra se rapprocher des puces de la série A d'Apple en termes de performances de pointe. Même si le Cortex-X1 ne correspond pas à l'A14, il sera plus proche qu'il ne l'était au cours des sept dernières années.

Le prochain Qualcomm Snapdragon 875 intégrera probablement à la fois le Cortex-X1 et le Cortex-A78 dans le cadre de ses «Prime Core» et «Performance Cores». HiSilicon n'est pas en position pour adopter la dernière IP d'ARM car TSMC n'a pas été autorisé à lui fournir des puces, de sorte que les téléphones Huawei ne disposeront pas des nouveaux cœurs de processeur cette année, et probablement même pas au début de l'année prochaine. Notamment, Samsung est en position de force pour adopter le Cortex-X1 + Cortex-A78 dans le cadre du prochain SoC phare Exynos, qui succédera au Exynos 990. Samsung a publié une déclaration dans laquelle il s'est dit «très enthousiaste» de voir la nouvelle direction que prend ARM avec le programme Cortex-X Custom. Le Cortex-X1 annule essentiellement l'entreprise de cœurs personnalisés échouée de Samsung. Il est à espérer que l'année prochaine, les téléphones Galaxy S21 / S30 alimentés par Exynos seront enfin exempts de déficits majeurs ou mineurs de performances du processeur par rapport à la concurrence alimentée par Snapdragon. Enfin, il n'est pas certain que MediaTek adoptera le Cortex-X1. le Dimension 1000Le successeur du successeur peut adopter uniquement l'A78, ou opter pour le combo X1 + A78 afin de rivaliser de front avec Qualcomm. Nous devrons attendre de voir comment les choses se dérouleront l'année prochaine.

L'avenir des performances du processeur sous Android semble prometteur, même en tant que producteur majeur de puces CPU se tient au bord de la fermeture.

Sources : ARM (1, 2), AnandTech