Huawei har introducerat sitt AI CloudMatrix 384-system, ett storskaligt kluster utformat för att konkurrera direkt med NVIDIA: s ledande GB200 NVL72-arkitektur genom att distribuera ett betydande antal av sina Ascend 910C-processorer. Tillkännagavs kort efter att den amerikanska regeringen effektivt begränsade exporten av NVIDIA: s H20 AI-chip till Kina omkring 15 april, representerar CloudMatrix 384 ett inhemskt alternativ som syftar till att fylla tomrummet.

Det uppnår prestandametriker som, på papper, överträder NVIDIA: s nuvarande flaggskepp gb200 nvl72 System i flera områden, men gör det genom en strategi som gynnar skala över Silicon Sophistication, resulterar i en starkkraft 910C, en dubbel-chiplet-processor som levererar 780 TFLOPS med BF16-numeriskt format vanligt i AI. Den fullständiga CloudMatrix 384-klustret integrerar 384 av dessa acceleratorer, och

Denna siffra överskrider de ungefär 180 PFLOPS tillskrivna NVIDIA: s 72-GPU GB200 NVL72-installation. Huaweis design packar också betydligt mer minne, med 49,2 TB totalt HBM (högt bandbreddminne, en typ av staplat minne som ger snabb datatillgång för processorer) jämfört med nVidias 13,8 tb och 1229 tb/s av total HBM-bandbredd kontra 576 tb/s.

Denna prestationsfördel, som uppnås genom att distribuera över fem gånger så många acceleratorer som NVIDIA-jämförelsessystemet, kommer till en brant energikostnad. CloudMatrix 384: s totala systemkraftkrav uppskattas till 559 kW, nästan fyra gånger den 145 kW som konsumeras av GB200 NVL72-konfigurationen.

Beräkningar baserade på dessa siffror indikerar Huawei-systemet är 2,3 gånger mindre effekte-effekt per tFLOP för BF16-komput och 1.8 Mindre mindre effekt. Effektivitet per terabyte av HBM-kapacitet är närmare, med Huaweis system med cirka 1,1 gånger mer kraft.

Denna skillnad belyser en strategisk anpassning till Kinas omständigheter-som kämpar med begränsad tillgång till den mest avancerade, kraftfulla chiptillverkningen medan man har riklig och relativt angivande energi. Electricity prices in parts of China have notably decreased, reportedly dropping to around $56/MWh in early 2025 from Tidigare nivåer nära $ 91/mwh i 2022 , vilket gör Power-hungry-system mer ekonomiskt genomförbart än de kan vara någon annanstans. För att möjliggöra detta storskaliga kluster är CloudMatrix 384: s nätverksarkitektur. Huawei har valt ett helt optiskt tillvägagångssätt för både inter-rack och intra-rack-kommunikation, vilket ansluter de 384 ASCED 910C-processorerna i ett allt-till-allt-nät. Detta innebär att man distribuerar en massiv 6,912 linjär pluggbar optik (LPO) sändtagare, var och en arbetar vid 800 Gbps.

LPO-teknik, ofta diskuterade i branschrapporter som dessa from LightCounting, is seen as a potentially lower-power option compared to traditional DSP-based transceivers for shorter data center reaches, potentially offering some Kraftbesparingar inom själva nätverket, även om hantering av signalintegritet i ett så stort, komplext optiskt nätverk presenterar sina egna utmaningar.

Den resulterande aggregerade interna bandbredden överträffar 5,5 pbps. SemiAnalysis calculates the system offers 2.1 times the scale-up bandwidth (within the 384-node cluster) and 5.3 times the scale-out bandwidth (for connecting multiple clusters) compared to the GB200 NVL72 baseline.

The overall 16-rack system design, with 12 compute racks and 4 dedicated network switching racks, bears resemblance to Nvidia’s unreleased dgx h100 nvl256″ranger”-plattform , som också innehöll en stor, optiskt ansluten multi-raps-design deemed och costy forproduktion för produktion för produktion för produktion för produktion. > navigera på sanktionerna Maze

Att utföra denna strategi beror på att säkerställa avancerade komponenter trots stränga amerikanska exportkontroller. While China’s SMIC can produce 7nm-class chips suitable for the Ascend 910C’s compute chiplets, analysis suggests the processors deployed so far primarily utilize chiplets fabricated by TSMC.

Huawei allegedly secured these restricted wafers – potentially enough for over a million Ascend 910C processors through 2025 – via intermediaries like Sophgo, circumventing direct sanctions against Huawei. Denna aktivitet ledde enligt uppgift till USA: s granskning, med TSMC som potentiellt inför en betydande böter som rapporterats i början av april.

Tillträde till Essential HBM2E-minne enligt uppgift innebär en liknande lösning, kanaling Samsung-komponenter genom distributör coasia elektronik, vars intäktsmässiga intäkter som är märkta med HBM-export. Paket som innehåller HBM, som sedan skickas till Kina där minnet påstås extraheras för användning i Huaweis slutliga Ascend 910C-moduler. Dessa manövrar understryker den pågående utmaningen att upprätthålla teknikexportkontroller.

Ett beräknat spel i Kinas AI-lopp

CloudMatrix 384-lanseringen är strategiskt tidsinställd. Den amerikanska åtgärden som stoppade NVIDIA H20-exporten tog bort en nyckelkonkurrent som specifikt är anpassad för den kinesiska marknaden under tidigare begränsningar. H20, även om en lägre prestanda jämfört med obegränsade NVIDIA GPU: er och potentiellt Huaweis tidigare 910B-chip, var NVIDIAs huvudsakliga kompatibla erbjudande för Kina, och förbudet tvingade företaget att ta en $ 5,5 miljarder avgift för relaterade inventering.

detta reglerande skift skapade en betydande marknadsöppning, men det är att vara en del av att göra det för relaterade inventering. simultaneously announced next-gen Ascend 920 chip.

The situation prompted Nvidia CEO Jensen Huang to Besök Peking Strax efter förbudet, där han enligt uppgift sade att Nvidia hoppades”att fortsätta att samarbeta med Kina.”

analytiker Patrick Moorhead förutspådde resultatet på ett otydligt sätt:”Kinesiska företag kommer bara att byta till Huawei.”This aligns with broader Chinese technology goals, seen in initiatives like the phase-out of foreign telecom chips and the substantial “Big Fund”supporting domestic semiconductor development. Huaweis CloudMatrix 384 visar en väg till konkurrenskraftiga AI-systemprestanda nu, och accepterar högre kraftanvändning medan du navigerar i en komplex global leveranskedja under geopolitiska begränsningar.

Categories: IT Info