Huawei a introdus sistemul său AI CloudMatrix 384, un cluster pe scară largă conceput pentru a concura direct cu arhitectura principală GB200 NVL72 a NVIDIA prin implementarea unui număr substanțial de procesoarele sale Ascend 910C. Anunțat la scurt timp după ce guvernul american a restricționat eficient exporturile de cip AI H20 din Nvidia în China, în jurul 15 aprilie, CloudMatrix 384 reprezintă o alternativă internă care urmărește să completeze golul.

, realizează valori de performanță care, pe hârtie, depășește actualul flagship al Nvidia GB200 NVL72 Sistemul din mai multe domenii, dar face acest lucru printr-o strategie care favorizează scara peste sofisticarea siliconului, rezultând o fundație de consum de putere. Un procesor dual-chiplet care furnizează 780 de Tflops folosind formatul numeric BF16 comun în AI. Clusterul Full CloudMatrix 384 integrează 384 dintre acești acceleratori, iar conform Semianalys Total estimat de 300 PFLOPS de performanță BF16 densă.

Această cifră depășește aproximativ 180 de PFLOPS atribuite configurației NVL72 de 72-GPU GB200 NVIDIA. Designul lui Huawei împachetează, de asemenea, mai multă memorie, cu 49,2 TB de HBM total (memorie de lățime de bandă mare, un tip de memorie stivuită care oferă acces rapid la date pentru procesoare) comparativ cu 13,8 TB de la NVIDIA, iar 1229 TB/s de total de bandă HBM față de 576 TB/s.

Acest avantaj de performanță, obținut prin implementarea de peste cinci ori mai mult acceleratoare decât sistemul de comparație NVIDIA, are un cost energetic abrupt. Cerința totală de putere a sistemului CloudMatrix 384 este estimată la 559 kW, de aproape patru ori mai mult decât 145 kW consumat de configurația GB200 NVL72.

Calculele bazate pe aceste cifre indică sistemul Huawei este de 2,3 ori mai puțin eficient de putere per Tflop de BF16 compute și de 1,8 ori mai puțin eficient pe TB/SIND de memorie a Bf16. Eficiența pe terabyte a capacității HBM este mai aproape, sistemul Huawei folosind de aproximativ 1,1 ori mai multă putere.

Această disparitate evidențiază o adaptare strategică la circumstanțele Chinei-printr-un acces restrâns la cea mai avansată, eficientă, eficientă a cipului de fabricare a cipului de energie mare și relativ relativ accesibilă. Prețurile energiei electrice din părți din China au scăzut în special, se presupune că aruncând în jur de 56 $/mwh în 2025 de la în 2025 de la la 2025 de la la 2025 href=”https://www.global-climatescope.org/markets/mainland-china”țintă=”_ blank”> niveluri anterioare aproape de 91 $/MWH în 2022 , făcând sistemele înfometate cu putere mai mult din punct de vedere economic decât ar putea fi în altă parte.

Cheia pentru a permite acest cluster pe scară largă este arhitectura de rețea CloudMatrix 384. Huawei a optat pentru o abordare integrală atât pentru comunicarea inter-rack, cât și pentru cele intra-rack, conectând procesoarele 384 Ascend 910C într-o plasă atot-to-tol. Aceasta implică implementarea unui masiv de 6.912 transceiveruri optice liniare liniare (LPO), fiecare funcționând la 800 Gbps.

tehnologie LPO, adesea discutată în rapoartele din industrie precum cele from LightCounting, is seen as a potentially lower-power option compared to traditional DSP-based transceivers for shorter data center reaches, Oferind potențial unele economii de energie în cadrul țesăturii de rețea în sine, deși gestionarea integrității semnalului într-o rețea optică atât de mare și complexă prezintă propriile sale provocări.

Agregatul agregat de lățime internă de bandă depășește 5,5 PBPS. Semianaliza calculează sistemul oferă de 2,1 ori mai mult decât lățimea de bandă la scară (în clusterul cu 384 noduri) și de 5,3 ori lățimea de bandă la scară (pentru conectarea mai multor clustere), comparativ cu linia de bază GB200 NVL72.

GB200 NVL72. href=”https://pytorchtoatoms.substack.com/p/why-dgx-h100-nvl256-never-hipped”target=”_ blank”> DGX H100 NVL256″Ranger”Platforma , care a prezentat, de asemenea, o producție mare, conectată optic, design multi-rack Deemed prea complex și costisitor pentru producție pentru producție. > Navigarea Sancțiunilor Maze

Executarea acestei strategii depinde de asigurarea componentelor avansate, în ciuda controalelor stricte de export din SUA. While China’s SMIC can produce 7nm-class chips suitable for the Ascend 910C’s compute chiplets, analysis suggests the processors deployed so far primarily utilize chiplets fabricated by TSMC.

Huawei allegedly secured these restricted wafers – potentially enough for over a million Ascend 910C processors through 2025 – via intermediaries like Sophgo, circumventing direct sancțiuni împotriva lui Huawei. Se pare că această activitate a condus la examinarea SUA, TSMC se confruntă cu o amendă semnificativă, așa cum este raportat la începutul lunii aprilie.

Accesarea memoriei esențiale HBM2E presupune o soluție similară, canalizarea componentelor Samsung prin distribuitor Coasia Electronics, a căror venituri au crescut vizibil în urma tehnologiei exportului HBM și a unei sesizări. Pachete intermediare care conțin HBM, care sunt apoi expediate în China, unde memoria este extrasă pentru a fi utilizată în modulele finale din Huawei Ascend 910C ale lui Huawei. Aceste manevre subliniază provocarea continuă a aplicării controalelor de export de tehnologie.

Un joc calculat în cursa AI din China

Lansarea CloudMatrix 384 este cronometrată strategic. Acțiunea americană care oprește exporturile NVIDIA H20 a eliminat un concurent cheie special adaptat pentru piața chineză în conformitate cu restricțiile anterioare. H20, deși o parte cu performanță mai mică în comparație cu GPU-urile Nvidia nelimitate și potențialul cipului anterior de 910B al lui Huawei, a fost principala ofertă conformă pentru China, iar interdicția a obligat compania să preia o taxă de 5,5 miliarde de dolari pentru inventarul aferent. Anunțat simultan NEXT-GEN ASCEND 920 Chip.

Situația a determinat CEO-ul NVIDIA, Jensen Huang, la Vizitați Beijing La scurt timp după interdicție, unde a declarat că Nvidia spera că „să continue să coopereze cu China. Acest lucru se aliniază cu obiective tehnologice chineze mai largi, observate în inițiative precum Faza de ieșire a telecomunicațiilor străine. CloudMatrix 384 de la Huawei arată o cale către performanța competitivă a sistemului AI acum, acceptând o utilizare mai mare a puterii în timp ce navigați într-un lanț de aprovizionare global complex sub constrângeri geopolitice.