La dernière puce d’IA exportable restante de Nvidia vers la Chine-le H20-est maintenant menacée de deux directions: des règles nationales d’efficacité énergétique nouvellement appliquées et un actions du fabricant de chip secteur en raison de la non-conformité des normes d’efficacité du gouvernement.

Le 27 mars, Reuters a rapporté que le fabricant de serveurs chinois H3C avait averti les clients d’une pénurie imminente de puces H20. The alert pointed to soaring demand and ongoing uncertainty around supply—part of a growing trend following months of hardware stockpiling in China.

With all other Nvidia AI chips—A100, H100, A800, et H800-Avant la liste noire, le H20 est devenu le dernier pied juridique de l’entreprise sur le marché chinois de l’IA.

Green Standards UPEND Market Access

La Commission nationale de développement et de réforme de la Chine (NDRC) a ajouté une nouvelle couche de complexité avec le déploiement de l’énergie-effectif des benchmarks de benchmarks pour les AI. Ces règles se concentrent sur la «puissance de l’énergie par calcul» et l’efficacité de l’utilisation de l’énergie (PUE)-une métrique qui évalue la quantité d’énergie qu’un centre de données utilise pour le calcul réel par rapport aux frais généraux comme le refroidissement ou les infrastructures. Ces alternatives offrent «le double de l’efficacité à une consommation d’énergie plus faible», ce qui met en désavantage Nvidia car Pékin priorise l’infrastructure d’IA à faible teneur en carbone.

Les nouvelles normes ne sont pas des directives à court terme. Chine Conseil d’État a découvert une politique 2024 2030.

nvidia devrait considérer les modifications techniques au H20 pour se conformer, selon les rapports antérieurs. Cependant, la modification de la puce pourrait réduire ses performances et affecter sa compétitivité contre les alternatives locales déjà optimisées.

H20 stockant conduit par Deepseek AI

La récente pointe de la demande H20 n’était pas spontanée. Il a été largement motivé par la montée en puissance de Deepseek IA, qui a rapidement gagné le terrain cet hiver en tant que rival chinois à Openai.

À mesure que l’utilisation de Deepseek augmentait sur les plateformes d’entreprise, les entreprises se sont précipitées pour garantir la puissance de calcul nécessaire pour exécuter les charges de travail en inférence et la formation modèle. Cette ruée s’est transformée en une vague de stockage, alors que les entreprises se précipitaient pour acquérir autant de puces H20 que possible avant que de nouvelles restrictions d’exportation ne touchent.

Washington interdit d’abord les GPU A100 et H100 de Nvidia en octobre 2022, citant des problèmes de sécurité nationale. Nvidia a répondu en lançant les puces A800 et H800-downgrades qui ont ensuite été confrontées à des interdictions à la fin de 2023. Le H20 a émergé comme une solution de contournement finale. Mais même cette fenêtre peut être clôturée.

Le 26 mars, un jour avant l’alerte H3C, le Département du commerce américain a élargi ses restrictions d’exportation d’IA, ajoutant des dizaines d’entreprises chinoises à sa liste d’entités. Parmi eux, six filiales du groupe Inspur, un majeur de Nvidia. Cette décision, ainsi que des licences resserrées pour le matériel d’IA, soulèvent la probabilité que même les puces H20 nécessiteront bientôt des approbations d’exportation au cas par cas-si elles sont autorisées du tout.

Nvidia lui-même a averti que si le H20 est ajouté à l’exportation américaine Blacklist, il éliminerait les dernières ventes de puces AI et les autres à Nvidia. Stratégies AI

Même les meilleurs clients de Nvidia repensent leur dépendance à son matériel. Tencent, l’un des plus grands conglomérats technologiques de la Chine, a révélé lors de son appel de résultats du quatrième trimestre 2024 selon lequel il avait commencé à optimiser son infrastructure d’IA en adoptant des modèles les plus efficaces de Deepseek. Ces nouvelles architectures sont conçues pour réduire la dépendance au GPU tout en conservant des performances pour des tâches telles que la formation et l’inférence.

Selon le directeur de la stratégie de la société:”Nous obtenons une productivité beaucoup plus élevée sur une formation de modèles de langues importante des GPU existants sans avoir besoin d’ajouter des GPU supplémentaires au rythme précédemment attendu.”Cette déclaration reflète une évolution plus large de l’industrie vers des stratégies de calcul axées sur l’efficacité.

Alors que Tencent a passé des ordres H20 substantiels pour soutenir l’intégration du modèle Deepseek dans des plates-formes comme WeChat, sa direction à plus long terme favorise les modèles plus petits, la spécialisation architecturale et les sources locales.

En même temps, les contraintes d’infrastructure persistent. Début février, Deepseek a temporairement interrompu les recharges d’API en raison d’un trafic accablant, soulignant la véritable pression sur le squelette de calcul de la Chine comme indiqué précédemment.

Le compromis de compétitivité de conformité

Le H20 est une puce construite par compromis. Après des interdictions antérieures sur ses GPU AI phares, NVIDIA a conçu le H20 pour tomber en dessous des seuils d’exportation américains tout en répondant aux besoins clés des clients. Mais ce faisant, il s’est laissé ouvert à un autre type de compression régulatrice-l’un imposé à l’intérieur des frontières de la Chine.

avec Pékin visant à réduire les émissions des centres de données et à déplacer l’approvisionnement vers un matériel optimisé par l’énergie, Nvidia se retrouve à vendre un produit qui ne peut plus être politiquement ou commercial. Dans le même temps, l’emprise de resserrement de Washington sur la conformité à l’exportation pourrait étouffer tout effort pour réviser la puce pour de meilleures performances ou efficacité.

Les décideurs chinois se serrent également sur les voies d’acquisition indirecte des puces. Les rapports de plusieurs sources confirment que les États-Unis font pression sur les pays alliés comme les Pays-Bas et le Japon pour limiter le service et la prise en charge des outils de fabrication de puces tels que les machines de lithographie DUV d’ASML, qui sont toujours largement utilisées en Chine.

Nvidia continue de générer des revenus à partir des clients de l’IA chinois pour l’instant. Mais cette position est régulièrement érodée par la géopolitique, les mandats politiques et une préférence croissante pour les alternatives locales. Ce qui ressemblait autrefois à une solution de contournement réglementaire intelligente est maintenant en collision avec un paysage politique qui est de plus en plus intolérant du compromis.

Categories: IT Info