A

huawei bemutatta az AI CloudMatrix 384 rendszert, egy nagyszabású klasztert, amelynek célja az NVIDIA vezető GB200 NVL72 architektúrájával való versenyzés, az ASCEND 910C processzorok jelentős számának telepítésével. Nem sokkal azután, hogy az Egyesült Államok kormánya hatékonyan korlátozta az NVIDIA H20 AI ChIP Kínába történő kivitelét április 15-én, a CloudMatrix 384 egy hazai alternatívát képvisel, amelynek célja az üresség kitöltése. href=”https://www.nvidia.com/en-us/data-center/gb200-nvl72/”Target=”_ üres”> GB200 NVL72 A rendszer több területen, de ezt a stratégiát támogatja a szilícium-szolcionáláshoz képest, az ASCECM 910-es számú, az ASCECE 910 CSAK BANULCE. Egy kettős chiplet processzor, amely 780 TFLOP-t szállít az AI-ben közös BF16 numerikus formátum felhasználásával. A teljes CloudMatrix 384 klaszter 384-et integrál ezekből a gyorsítókból, és szerint. 300 PFLOP-ból sűrű BF16 teljesítmény. A Huawei dizájnja szintén jelentősen több memóriát tartalmaz, 49,2 TB teljes HBM-vel (nagy sávszélesség-memória, egy halmozott memória típusú memória, amely gyors adathozzáférést biztosít a processzorok számára), mint az NVIDIA 13,8 TB-je, és 1229 TB/s az összes HBM Bandwidth/h2/s.

Ez a teljesítmény-előny, amelyet úgy érnek el, hogy ötször annyi gyorsítót telepít, mint az NVIDIA összehasonlító rendszer, meredek energiaköltséggel jár. A CloudMatrix 384 teljes rendszer teljesítményigényét 559 kW-ra becsülik, ami a GB200 NVL72 konfiguráció által fogyasztott 145 kW-os közel négyszerese. A HBM-kapacitás terabájt/terabájtja közelebb van, mivel a Huawei rendszere körülbelül 1,1-szer nagyobb energiát használ. A villamosenergia-árak Kína egyes részein jelentősen csökkentek, állítólag _ blank”> _ blank”> _ blank”> _ blank”>”_ üres”> csepp. href=”https://www.global-climatescope.org/markets/mainland-china”cél=”_ üres”> korábbi szintek közelében 91 dollár/mwh 2022-ben , az energia-hungry rendszerek gazdaságilag megvalósíthatóbbá válnak, mint másutt. Ez a nagyszabású klaszter lehetővé teszi a CloudMatrix 384 hálózati architektúráját. A Huawei mind az optikai megközelítést választotta mind az Inter-Rack, mind az Intra-Rack kommunikációhoz, összekapcsolva a 384 Ascend 910C processzorokat minden-mindenhálóban. Ez magában foglalja egy hatalmas, 6912 lineáris, pislogó optika (LPO) adó-vevők telepítését, amelyek mindegyike 800 Gbps-en működik. href=”https://www.lightcounting.com/resource/42/resourcefile/research%20note%20on%20lpo%20webinar%20092923.pdf”Target=”_ üres”> A LightCounting -ból származó potenciális központokhoz képest, a potenciálisan alacsonyabb Power opcióhoz képest, mint a tradicionális DSP-alapú adatokhoz, mint a potenciális, a potenciális, a potenciális központokhoz, mint a potenciális, a potenciális, a potenciális, a potenciális, a potenciális központokhoz, mint a potenciális, a tradicionális alapanyagokhoz, mint a tradicionális data. Néhány energiamegtakarítást kínálva magában a hálózati szövetben, bár a jel integritásának kezelése egy ilyen nagy, összetett optikai hálózatban saját kihívásait mutatja be. A Semianalysis kiszámítja a rendszer, amely a méretarányos sávszélesség 2,1-szerese (a 384 csomópontú klaszteren belül) és a skálázási sávszélesség 5,3-szorosa (több klaszter csatlakoztatásához), összehasonlítva a GB200 NVL72 kiindulási alaphoz. href=”https://pytorchtoatoms.substack.com/p/why-dgx-h100-nvl256-never-súgó”cél=”_ üres”> DGX H100 NVL256 “Ranger” platform , amely szintén szerepelt egy nagy, optikailag összekapcsolt multi-rotch-t, amely túlságosan komplexet tartott. > A szankciók labirintusának navigálása

Ennek a stratégiának a végrehajtása a fejlett alkatrészek biztosításától függ, annak ellenére, hogy szigorú amerikai exportvezérlők. Míg Kína az SMIC 7nm-es osztályú chipset képes előállítani, amely alkalmas az Ascend 910C számítási forgácsokhoz, az elemzés azt sugallja, hogy az eddig elsősorban a TSMC által készített forgácsokat használják. Huawei. Ez a tevékenység állítólag az amerikai ellenőrzéshez vezetett, amikor a TSMC potenciálisan jelentős bírsággal szembesül, amint azt április elején jelentették. tartalmazza a HBM-et, amelyet ezután Kínába szállítanak, ahol a memóriát állítólag a Huawei Final Ascend 910C moduljaiban való felhasználás céljából használják fel. Ezek a manőverek aláhúzzák a technológiai exportvezérlők végrehajtásának folyamatban lévő kihívását. Az NVIDIA H20 exportját megállítva az Egyesült Államok akciója, amely a korábbi korlátozások szerint kifejezetten a kínai piacra szabott kulcsfontosságú versenytársat távolított el. A H20, bár egy alacsonyabb teljesítményű rész a korlátlan NVIDIA GPU-khoz és potenciálisan Huawei korábbi 910B-es chipéhez képest, az NVIDIA legfontosabb megfelelõk Kína volt, és a tilalom arra kényszerítette a társaságot, hogy 5,5 milliárd dolláros díjat számítson fel a kapcsolódó leltárra. Egyidejűleg bejelentette a Next-Gen Ascend 920 chipet. Target=”_ üres”> Látogasson el Pekingbe. Ez összhangban áll a szélesebb kínai technológiai célokkal, olyan kezdeményezésekben, mint például a Blank-kondicionáló. A Huawei CloudMatrix 384 megmutatja a versenyképes AI rendszer teljesítményét, elfogadva a nagyobb energiafelhasználást, miközben egy komplex globális ellátási láncot navigál geopolitikai korlátok alatt.