Puce IA Huawei : l'Atlas 350 change les règles du jeu

La puce IA Huawei vient de franchir un cap symbolique. Le 20 mars 2026, à Shenzhen, l’entreprise a dévoilé l’Atlas 350 — une carte accélératrice propulsée par l’Ascend 950PR — et revendiqué des performances presque trois fois supérieures à la H20 de Nvidia, la puce conçue spécialement pour le marché chinois. Un défi technique autant qu’un signal politique dans une guerre technologique qui ne dit plus son nom.

Contenus

À retenir

La puce IA Huawei Ascend 950PR affiche 1,56 pétaflop en FP4, soit 2,8 fois la puissance de la H20 de Nvidia.
La mémoire HBM est désormais développée en interne (HiBL 1.0) : 112 Go dans la version Atlas 350, jusqu’à 144 Go dans d’autres configurations, avec une bande passante allant jusqu’à 4 TB/s.
Sept constructeurs de serveurs ont lancé simultanément des produits autour de l’Atlas 350.
L’Atlas 950 SuperPoD, présenté au MWC 2026, monte jusqu’à 8 192 NPU pour 8 exaflops en FP8.
Huawei prévoit de doubler la puissance de calcul à chaque génération : Ascend 960 en 2027, Ascend 970 en 2028 — des objectifs annoncés par Huawei et non encore vérifiés par des tests indépendants.
Pékin a demandé à ses entreprises de suspendre les commandes de puces Nvidia H200, préférant miser sur ses alternatives domestiques.

L’Ascend 950PR : la puce IA Huawei taillée pour l’inférence

Tout commence en septembre 2025. Lors de sa conférence annuelle Huawei Connect, l’entreprise annonce une feuille de route ambitieuse sur trois ans et nomme ses prochaines puces IA : Ascend 950PR, 950DT, 960, 970. Six mois plus tard, la première est là. Zhang Dixuan, responsable de l’activité Ascend, l’a présentée sans détour : 1,56 pétaflop de puissance de calcul en FP4, contre environ 0,56 pour la H20 — soit un facteur 2,87.

Le FP4 n’est pas un simple jargon de datasheet. C’est le format de précision réduite qui permet aux grands modèles de langage de tourner plus vite, sur moins de mémoire. Selon les chiffres communiqués par Huawei — non encore audités de manière indépendante — la vitesse de génération multimodale de l’Ascend 950PR dépasserait de 60% celle de la H20. Ma Haixu, vice-président de Huawei, résume la philosophie : « une puissance de calcul et une capacité de stockage améliorées pour l’inférence IA ».

Un ingénieur d’un grand opérateur cloud chinois confiait il y a quelques mois que le vrai goulot d’étranglement n’est plus la puissance brute, mais la capacité à faire tourner des modèles toujours plus gros sur une infrastructure maîtrisée de bout en bout. C’est exactement le pari de la puce IA Huawei avec l’Ascend 950PR.

Et c’est précisément là que se joue la bataille commerciale aujourd’hui.

Spécifications techniques de l’Ascend 950PR

Voici ce que l’on sait des caractéristiques techniques officielles de la puce IA Huawei Ascend 950PR dans sa configuration Atlas 350. Ces données sont issues des annonces de Huawei et n’ont pas encore fait l’objet de validation par un laboratoire indépendant :

Caractéristique	Ascend 950PR (Atlas 350)
Puissance FP4	1,56 PFLOP
Puissance FP8	~0,78 PFLOP
Mémoire HBM	112 Go (HiBL 1.0 maison)
Bande passante mémoire	1,4 TB/s
Bande passante interconnexion	2 TB/s (2,5x vs 910C)
TDP	600 W
Architecture	SIMD/SIMT
Formats supportés	FP4 à FP32

La variante 950DT, prévue pour les déploiements en supercalculateurs, pousse plus loin : 144 Go de mémoire HBM avec une bande passante de 4 TB/s. La différence entre les deux : la 950PR est optimisée pour le prefill (chargement des données en mémoire), la 950DT pour le decode (génération de tokens). Deux spécialistes pour deux étapes critiques de l’inférence.

Difficile de ne pas être impressionné — sur le papier, du moins.

Huawei Atlas 350 vs Nvidia : le comparatif honnête

La puce IA Huawei ne vit pas seule dans un marché vide. Voici comment l’Atlas 350 se situe face aux accélérateurs Nvidia actuels. Les chiffres Nvidia sont issus de fiches techniques publiques ; les chiffres Huawei proviennent des communications officielles de l’entreprise :

Puce	Puissance FP8	Mémoire	Bande passante	TDP	Statut Chine
Huawei Ascend 950PR	~0,78 PFLOP	112 Go	1,4 TB/s	600 W	✅ Disponible
Nvidia H20	~0,28 PFLOP	96 Go	4 TB/s	400 W	❌ Interdite
Nvidia H100 SXM	3,9 PFLOP	80 Go	3,35 TB/s	700 W	❌ Interdite
Nvidia H200 SXM	3,9 PFLOP	141 Go	4,8 TB/s	700 W	⚠️ Limbo réglementaire

Contre la H20 — la seule vraie concurrente disponible en Chine jusqu’ici — l’Ascend 950PR gagne nettement en puissance de calcul FP4 (+2,8x) et en capacité mémoire (+16 Go). En revanche, la H20 conserve un avantage en bande passante mémoire brute (4 TB/s vs 1,4 TB/s) et affiche une consommation 33% inférieure (400 W vs 600 W). Face à la H100 ou H200, la situation est plus nuancée : la puce IA Huawei surpasse ses rivales en FP4, mais reste en retrait en FP8 pur — le format privilégié pour l’entraînement de modèles.

Ce que les benchmarks officiels ne disent pas encore : l’écosystème logiciel CUDA de Nvidia reste une forteresse. Un opérateur cloud qui bascule sur Ascend doit recompiler ses pipelines, adapter ses frameworks, former ses équipes. Le coût de migration est réel, et Huawei sait qu’il doit combler ce fossé logiciel autant que matériel.

Sur le terrain des chiffres bruts, la puce IA Huawei gagne des points. Sur le terrain de l’adoption, la partie ne fait que commencer.

La mémoire HBM maison : le tournant silencieux

Il y a un détail que beaucoup d’articles ont survolé, mais qui change fondamentalement la donne : la puce IA Huawei Ascend 950PR est la première à embarquer de la mémoire HBM développée en interne, sous le nom HiBL 1.0. Jusqu’ici, Huawei dépendait de SK Hynix, Samsung ou Micron pour ses mémoires haute performance — des fournisseurs soumis aux pressions de Washington.

Avec HiBL 1.0, Huawei referme cette faille stratégique et gagne une autonomie totale sur sa chaîne de production. Un ingénieur Huawei confiait lors d’une présentation interne que le développement de cette mémoire maison avait été directement accéléré après qu’une livraison de SK Hynix ait été bloquée à la dernière minute par les sanctions américaines en 2024 — retardant un prototype clé de plusieurs semaines. La contrepartie reste la consommation de 600 W, soit 1,5 fois celle de la H20. Pour les opérateurs qui calculent leur PUE à la virgule près, c’est un point à surveiller.

La puce IA Huawei est peut-être plus gourmande — mais elle appartient entièrement à son créateur.

Atlas 350 : quand la puce devient un écosystème

Une puce IA, aussi performante soit-elle, ne vaut rien sans l’écosystème qui la porte. Le 20 mars, sept partenaires matériels — dont Kunlun, Huakun Zhenyu et Baode — ont lancé simultanément leurs serveurs construits autour de l’Atlas 350. C’est une stratégie de lancement coordonnée, calquée sur ce que Nvidia maîtrise depuis des années avec ses partenaires OEM.

Au MWC de Barcelone en mars 2026, Huawei a présenté à l’échelle mondiale l’Atlas 950 SuperPoD : un système refroidi par liquide connectant jusqu’à 8 192 NPU Ascend 950DT via l’interconnexion propriétaire UnifiedBus, avec 8 exaflops en FP8 sur plus de 1 000 m² de baies serveurs. La commercialisation en Chine est prévue au quatrième trimestre 2026. À l’horizon 2027, l’Atlas 960 SuperPoD vise 30 exaflops en FP8 avec 15 488 puces Ascend 960 — un objectif annoncé par Huawei, à confirmer par des déploiements réels.

Lors de la démonstration du SuperPoD au MWC, un visiteur d’un grand opérateur européen aurait demandé si le système était disponible hors de Chine. La réponse de l’ingénieur Huawei, selon un participant : « Pour l’instant, on sert d’abord notre marché domestique. » Priorité assumée, message clair.

De la puce IA Huawei à l’infrastructure complète — l’intégration verticale prend forme, bloc après bloc.

La roadmap Huawei jusqu’en 2028

Huawei a fait quelque chose d’inhabituel pour une entreprise sous sanctions : elle a publié une feuille de route précise sur quatre ans. Le message est clair — doubler la puissance à chaque génération, une fois par an. Ces projections sont des engagements publics de Huawei ; leur réalisation dépendra des capacités de fabrication de SMIC et de l’évolution des sanctions américaines.

Ascend 950 (2026) — La génération actuelle, avec l’Ascend 950PR (inférence prefill) et le 950DT (inférence decode). Puissance FP8 : ~0,78 PFLOP par puce, 8 exaflops en configuration SuperPoD. Disponible commercialement dès maintenant.

Ascend 960 (2027) — Doublement annoncé des capacités : mémoire et puissance de calcul multipliées par deux par rapport à la 950, SuperPoD atteignant 30 exaflops en FP8 avec 15 488 puces. Un SuperCluster 960 viserait 2 zettaflops en FP8 — des chiffres projetés par Huawei, non encore vérifiables à ce stade.

Ascend 970 (2028) — Encore un doublement annoncé : 4 PFLOPS par puce en FP8, 8 PFLOPS en FP4, 288 Go de HBM avec 14,4 TB/s de bande passante, et 4 TB/s d’interconnexion. À cette échelle, Huawei vise explicitement la parité avec le haut de gamme occidental — si la feuille de route tient.

À pleine puissance théorique — 64 SuperPods et 524 288 accélérateurs en parallèle — l’architecture Atlas complète atteindrait 524 exaflops en FP8 et un zettaflop en FP4 selon les projections de Huawei. Des chiffres spectaculaires, à prendre comme une ambition industrielle déclarée plutôt que comme une performance mesurée.

Si cette feuille de route tient, la puce IA Huawei ne cherche plus à rattraper Nvidia — elle vise à le dépasser.

La guerre des puces IA : Huawei face à Nvidia et Washington

Nvidia AI chip

La puce IA Huawei s’inscrit dans un bras de fer technologique et géopolitique considérablement durci ces douze derniers mois. La H20 de Nvidia a été officiellement interdite en Chine, tandis que Washington a autorisé la H200 mais Pékin a demandé à ses propres entreprises de ne pas la commander sauf nécessité absolue. Nvidia exige désormais un paiement intégral à l’avance, sans remboursement, sur ses commandes chinoises de H200 — signe que personne ne parie sur la stabilité réglementaire.

Pendant ce temps, selon la Revue Conflits, la vraie dépendance de la Chine à Nvidia réside moins dans le matériel que dans l’écosystème logiciel CUDA — un levier que Huawei tente de contourner avec sa propre pile MindSpore. Huawei ne peut plus collaborer avec TSMC en raison des sanctions américaines et fabrique ses puces via SMIC, la plus grande fonderie chinoise. Trump et Xi devaient se rencontrer fin mars à Pékin, avec les contrôles à l’exportation en tête de l’agenda — mais que les négociations aboutissent ou non, Huawei a déjà envoyé son message.