Huawei CloudMatrix 384 AI-cluster presteert beter dan nvidia GB200

Huawei heeft zijn AI CloudMatrix 384-systeem geïntroduceerd, een grootschalig cluster dat is ontworpen om rechtstreeks te concurreren met de toonaangevende GB200 NVL72-architectuur van NVIDIA door een aanzienlijk aantal van zijn Ascend 910C-processors in te zetten. Kondig aangekondigd nadat de Amerikaanse regering de export van NVIDIA’s H20 AI-chip naar China rond 15 april effectief beperkt heeft href=”https://www.nvidia.com/en-us/data-center/gb200-nvl72/”target=”_ blank”> GB200 nvl72 Systeem in verschillende gebieden, maar doet dit door een strategie die de voorkeur geeft aan een strategie voorschaal boven silicon sophistication, resulterend in een Stark Power Consumptie. 910c, een dual-chiplet-processor die 780 TFLOPS levert met behulp van het BF16-numerieke formaat dat gebruikelijk is in AI. De volledige CloudMatrix 384-cluster integreert 384 van deze versnellers, en vorige niveaus nabij $ 91/mwh in 2022 , het maken van power-hungry-systemen economisch haalbaar dan ze elders zouden kunnen zijn. Het inschakelen van dit grootschalige cluster is de netwerkarchitectuur van de CloudMatrix 384. Huawei heeft gekozen voor een all-optische benadering voor zowel inter-rack als intra-rack communicatie, waardoor de 384 ASCEND 910C-processors in een all-tot-all mesh worden verbonden. Dit omvat het implementeren van een enorme 6.912 lineaire pluggable optica (LPO) transceivers, die elk werken met 800 Gbps.

LPO-technologie, vaak besproken in industriële rapporten zoals die from LightCounting, is seen as a potentially lower-power option compared to traditional DSP-based transceivers for shorter data center reaches, Potentieel wat stroombesparingen binnen de netwerkstof zelf bieden, hoewel het beheer van signaalintegriteit in zo’n groot, complex optisch netwerk zijn eigen uitdagingen presenteert.

De resulterende geaggregeerde interne bandbreedte overtreft 5,5 Pbps. SemiAnalysis calculates the system offers 2.1 times the scale-up bandwidth (within the 384-node cluster) and 5.3 times the scale-out bandwidth (for connecting multiple clusters) compared to the GB200 NVL72 baseline.

The overall 16-rack system design, with 12 compute racks and 4 dedicated network switching racks, bears resemblance to Nvidia’s unreleased dgx h100 nvl256″ranger”platform , die ook een grote, optisch verbonden multi-rack-ontwerp was, te complex en kostbaar voor productie op het tijdstip. > navigeren door het sancties Maze

Het uitvoeren van deze strategie hangt af van het beveiligen van geavanceerde componenten ondanks strikte US Export Controls. While China’s SMIC can produce 7nm-class chips suitable for the Ascend 910C’s compute chiplets, analysis suggests the processors deployed so far primarily utilize chiplets fabricated by TSMC.

Huawei allegedly secured these restricted wafers – potentially enough for over a million Ascend 910C processors through 2025 – via intermediaries like Sophgo, circumventing direct sanctions tegen Huawei. This activity reportedly led to US scrutiny, with TSMC potentially facing a significant fine as reported in early April.

Accessing essential HBM2E memory reportedly involves a similar workaround, channeling Samsung components through distributor CoAsia Electronics, whose revenue noticeably increased following HBM export controls.

This involves design firm Faraday Technology and assembler SPIL creating technically compliant Gemiddeld pakketten met de HBM, die vervolgens naar China worden verzonden, waar het geheugen naar verluidt wordt geëxtraheerd voor gebruik in Huawei’s laatste ASCEND 910C-modules. Deze manoeuvres onderstrepen de voortdurende uitdaging van het afdwingen van technologie-exportcontroles.

Een berekende gok in de AI-race van China

De lancering van de CloudMatrix 384 is strategisch getimed. De Amerikaanse actie die NVIDIA H20-export stopt, verwijderde een belangrijke concurrent die specifiek is afgestemd op de Chinese markt onder eerdere beperkingen. De H20, hoewel een lager presterend deel in vergelijking met onbeperkte NVIDIA GPU’s en mogelijk de voorgaande 910b-chip van Huawei, was het belangrijkste compatibele aanbod van Nvidia voor China, en het verbod dwong het bedrijf een $ 5,5 miljard kosten te nemen voor gerelateerde inventaris. Tegelijkertijd aangekondigd Next-Gen Ascend 920 Chip.

De situatie bracht NVIDIA CEO Jensen Huang aan Bezoek Beijing Kort na het verbod, waar hij naar verluidt verklaarde dat Nvidia hoopte”om te blijven samenwerken met China.”

analist Patrick Moorhead voorspelde de uitkomst botweg:”Chinese bedrijven zullen gewoon overschakelen naar Huawei.”Dit past bij bredere Chinese technologiedoelen, te zien in initiatieven zoals de fase-out van buitenlandse telecom”fase-out van buitenlandse telecom-ontwikkeling. CloudMatrix 384 van Huawei toont nu een pad naar concurrerende AI-systeemprestaties, waardoor een hoger vermogensgebruik wordt geaccepteerd terwijl ze een complexe wereldwijde supply chain onder geopolitieke beperkingen navigeren.

Huawei CloudMatrix 384 AI-cluster presteert beter dan nvidia GB200

Published by All Things Windows on April 20, 2025

Een berekende gok in de AI-race van China

IT Info

Meta Antitrust Trial opent onder schaduw van klokkenluidersclaims en politiek manoeuvreren

IT Info

Rapport: 57 niet-vermelde Chrome-extensies hebben 6 miljoen gebruikers blootgesteld aan cookie-diefstal, het volgen van risico’s

IT Info

Google brengt Gemma 3 QAT AI-modellen vrij voor GPU’s van de consument

Huawei CloudMatrix 384 AI-cluster presteert beter dan nvidia GB200

Published by All Things Windows on April 20, 2025

Een berekende gok in de AI-race van China

Related Posts

IT Info

Meta Antitrust Trial opent onder schaduw van klokkenluidersclaims en politiek manoeuvreren

IT Info

Rapport: 57 niet-vermelde Chrome-extensies hebben 6 miljoen gebruikers blootgesteld aan cookie-diefstal, het volgen van risico’s

IT Info

Google brengt Gemma 3 QAT AI-modellen vrij voor GPU’s van de consument