Huawei on ottanut käyttöön AI CloudMatrix 384-järjestelmänsä, laajamittaisen klusterin, joka on suunniteltu kilpailemaan suoraan NVIDIA: n johtavan GB200 NVL72-arkkitehtuurin kanssa ottamalla käyttöön huomattava määrä Ascend 910C-prosessoreilleen. Pian ilmoitettu Yhdysvaltain hallituksen tehokkaasti rajoitetun NVIDIA: n H20-AI-sirun viennin Kiinassa 15. huhtikuuta noin 15. huhtikuuta, CloudMatrix 384 edustaa kotitalousvaihtoehtoa, joka pyrkii täyttämään tyhjän. href=”https://www.nvidia.com/en-us/data-center/gb200-nvl72/”Target=”_ tyhjä”> GB200 NVL72 Järjestelmä useilla alueilla, mutta tekee niin strategian suosimisen asteikon kautta silikonien hienostuneisuuteen, joka johtaa Strench 910C: n. Kaksoiskiplettiprosessori, joka toimittaa 780 TFLOPS: ää käyttämällä BF16-numeerista muotoa, joka on yleinen AI: ssa. Täysi CloudMatrix 384-klusteri integroi 384 näistä kiihdyttimistä ja Semianals Arvioitu kokonaismäärä 300 pflopia tiheästä BF16-suorituskyvystä.
Tämä luku ylittää NVIDIA: n 72-GPU GB200 NVL72-asetusten osoitetun noin 180 pFLOP: n. Huawein malli pakkaa myös huomattavasti enemmän muistia, ja siinä on 49,2 TB HBM: n kokonaismäärästä (korkea kaistanleveysmuisti, tyyppinen pinottu muisti, joka tarjoaa prosessorien nopean tiedonsiirron) kapasiteettia verrattuna NVIDIA: n 13,8 TB: n ja 1229 TB/S: n kokonaismäärän HBM-kaistanleveyden verrattuna mittakaavaan, ei 576 TB/s.
Tämä suorituskykyetu, joka saavutetaan ottamalla käyttöön yli viisi kertaa niin monta kiihdyttimää kuin NVIDIA-vertailujärjestelmä, on jyrkkä energiakustannus. CloudMatrix 384: n kokonaisjärjestelmän tehovaatimus on 559 kW, lähes neljä kertaa GB200 NVL72-kokoonpanon kuluttama 145 kW. HBM-kapasiteetin teratavun tehokkuus on lähempänä, kun Huawein järjestelmä käyttää noin 1,1 kertaa enemmän voimaa.
Tämä ero korostaa strategista sopeutumista Kiinan olosuhteisiin-kamppailee rajoitetun pääsyn kanssa edistyneimpiin, tehokkaimpiin sirujen valmistukseen samalla, kun sillä on runsaasti ja suhteellisen edullisen energiainfrastruktuurin. Sähkön hinnat Kiinan osissa ovat erityisesti laskeneet, ilmoitetusti pudota href=”https://www.global-climatescope.org/markets/mainland-china”Target=”_ tyhjä”> Aikaisemmat tasot lähellä 91 dollaria/mWh vuonna 2022 , mikä tekee voimankäyttöjärjestelmistä taloudellisesti toteuttamiskelpoisempia kuin ne voivat olla muualla. Tämän laajamittaisen klusterin käyttöönotto on CloudMatrix 384: n verkkoarkkitehtuuri. Huawei on valinnut all-optisen lähestymistavan sekä rakeiden väliseen että sisäisen viestinnän kanssa yhdistäen 384: n nousevan 910C-prosessorin kaiken kaikkiaan. Tähän sisältyy massiivisen 6 912 lineaarisen pullotettavan optiikan (LPO) lähetinvastaanottimien käyttöönotto, jokainen toimii 800 Gbps: n nopeudella.
LPO-tekniikka, jota käsitellään usein teollisuusraporteissa, kuten LightCounting-verkkoon. Jotkut virransäästöt itse verkkokankaan sisällä, vaikka signaalin eheyden hallinta niin suuressa, monimutkaisessa optisessa verkossa esittelee omat haasteensa.
tuloksena oleva aggregaatti sisäinen kaistanleveys ylittää 5,5 pbps. Semianalyysi laskee Järjestelmän tarjoaa 2,1 kertaa asteikon kaistanleveyden (384-solmuklusterin sisällä) ja 5,3-kertainen kaistanleveyteen (useiden klustereiden yhdistämiseen) verrattuna GB200 NVL72-lähtötilanteeseen.
16-levyn kokonaisjärjestelmän suunnittelu, 12 ketjutelineiden ja 4 omistautuneen verkkokytkimen telineiden kanssa. href=”https://pytorchtoatoms.substack.com/p/why-dgx-h100-nvl256-never-shipped”Target=”_ tyhjä”> DGX H100 NVL256 “Ranger”-alusta , joka esitti myös suuren, optisen kytketyn monirata-suunnittelun, joka oli liian monimutkainen ja kallistettu tuotantoon. > Sanktioiden sokkelo
Tämän strategian toteuttaminen riippuu edistyneiden komponenttien turvaamisesta huolimatta Yhdysvaltojen vientiä. Vaikka Kiinan SMIC voi tuottaa 7 nm: n luokan siruja, jotka sopivat Ascend 910c: n laskenta-siruille, analyysi ehdottaa, että tähän mennessä käytetyt prosessorit käyttävät ensisijaisesti TSMC: n valmistamia sirpaleita. Huawei. Tämä toiminta johti Yhdysvaltain tutkimukseen, kun TSMC: llä on mahdollisesti merkittävää sakkoa, kuten huhtikuun alussa ilmoitettiin. HBM: n sisältävät välipaketit, jotka sitten lähetetään Kiinaan, missä muisti on väitetysti uutettu käytettäväksi Huawein lopullisissa nousevissa 910C-moduuleissa. Nämä liikkeet korostavat jatkuvaa haastetta, joka koskee tekniikan vientivalvontaa.
Laskettu uhkapeli Kiinan AI-kilpailussa
CloudMatrix 384-julkaisu on strategisesti ajoitettu. Yhdysvaltojen toiminta, joka pysäyttää NVIDIA H20-viennin, poisti keskeisen kilpailijan, joka on erityisesti räätälöity Kiinan markkinoille aikaisempien rajoitusten nojalla. H20, vaikkakin heikompi osa verrattuna rajoittamattomaan Nvidia GPUS: n ja mahdollisesti Huawein aikaisempaan 910b-siruun, oli NVIDIA: n tärkein vaatimustenmukainen tarjonta Kiinalle, ja kielto pakotti yrityksen ottamaan 5,5 miljardin dollarin maksun liittyvästä varastosta.
tämä sääntelyvaihto loi myös huomattavan markkinoiden avaamisen Samanaikaisesti ilmoitettu seuraavan sukupolven nousu 920 Chip. Target=”_ tyhjä”> Vieraile Pekingissä Pian kiellon jälkeen, jossa hän ilmoitti Nvidian toivovan”jatkaa yhteistyötä Kiinan kanssa.”Tämä vastaa laajempia kiinalaisia teknologiatavoitteita, jotka on nähty aloitteissa, kuten Ulkomaalaisten puheiden poistot ja asiaan “Big Fund”-rahaston”tukeva perhe-sukupuoleen. Huawein CloudMatrix 384 näyttää polun kilpailukykyiseen AI-järjestelmän suorituskykyyn nyt, hyväksymällä korkeamman virrankäytön samalla kun navigoi monimutkaisessa globaalissa toimitusketjussa geopoliittisissa rajoituksissa.