Huawei wprowadził system AI CloudMatrix 384, klaster na dużą skalę zaprojektowaną do bezpośredniego konkurowania z wiodącą architekturą GB200 NVL72 NVIDIA poprzez wdrożenie znacznej liczby jego procesorów 910C. Ogłoszony krótko po tym, jak rząd USA skutecznie ograniczył eksport Chip H20 AI NVIDIA do Chin około 15 kwietnia, CloudMatrix 384 reprezentuje krajową alternatywę, której celem jest wypełnienie pustki.
osiąga wskaźniki wydajności, które na papierze przewyższają obecny flalny flagowy NVIDIA. href=”https://www.nvidia.com/en-us/data-center/gb200-nvl72/”target=”_ blank”> gb200 nvl72 System w kilku obszarach, ale jest to poprzez strategię faworyzującą skalę w stosunku do sofistyki na silikonie, wynika z wyrafinowania silikonowego, wynikającego z wyrafinowania silikonowego. 910C, procesor z podwójnym chipletem dostarczający 780 TFLOPS przy użyciu formatu numerycznego BF16 powszechnego w AI. Pełna klaster CloudMatrix 384 integruje 384 tych akceleratorów i
Liczba ta przekracza około 180 PFLPS przypisywanych konfiguracji NVIDIA 72-GPU GB200 NVL72. Projekt Huawei zawiera również znacznie więcej pamięci, z 49,2 TB całkowitego HBM (pamięć o wysokiej przepustowości, rodzaj pamięci ułożonej w stosie zapewniającej szybki dostęp do procesorów) Pojemność w porównaniu z wydajnością 13,8 tb NVIDIA, a 1229 TB/s całkowitej pasma HBM w porównaniu z 576 TB/s. w skali, nie wytwarzanie Ta zaleta wydajności, osiągnięta poprzez wdrożenie ponad pięć razy więcej akceleratorów niż system porównawczy NVIDIA, ma wysoki koszt energii. Całkowite zapotrzebowanie na zasilanie systemu CloudMatrix 384 szacuje się na 559 kW, prawie czterokrotnie 145 kW zużyty przez konfigurację GB200 NVL72. Obliczenia BF16 Compute i 1,8 razy mniej wydajne na te liczby. Wydajność na terabajt pojemności HBM jest bliżej, a system Huawei wykorzystuje około 1,1 razy większą moc.
Ta rozbieżność podkreśla strategiczną adaptację do okoliczności Chin-zmaganie się z ograniczonym dostępem do najbardziej zaawansowanej, wydajnej mocy produkcji układów, a jednocześnie ma dużą i stosunkowo przystępną infrastrukturę energetyczną. Ceny energii elektrycznej w niektórych częściach Chin znacznie spadły, podobno spadam do około 56 $ 56/M. href=”https://www.global-limatescope.org/markets/mainland-china”target=”_ blank”> Poprzednie poziomy w pobliżu 91 USD/mWh w 2022 r. , powodując, że systemy power-hungry są bardziej ekonomicznie wykonalne niż mogą być gdzie indziej.
optyka nad copperami Umożliwienie tego klastra na dużą skalę jest architektura sieci CloudMatrix 384. Huawei zdecydował się na całkowicie optyczne podejście zarówno do komunikacji interpretacyjnej, jak i wewnątrz rack, łącząc procesory 384 Ascend 910C w siatce całkowicie do wszystkich. Obejmuje to wdrożenie masywnych transceiverów optyki optycznej (LPO) 6912 liniowych, każdy z nich działał na 800 Gbps.
LPO, często omawiany w raportach branżowych, takich jak te
Powstała łączna wewnętrzna przepustowość przewyższa 5,5 PBP. Semianaliza oblicza system oferuje 2,1-krotność szerokości pasma w skali (w klastrze 384-węzłowym) i 5,3 razy większą szerokość pasma (do łączenia wielu klastrów) w porównaniu z niedźwiedziami GB200 NVL72.
Ogólny projekt 16-tańczycy, z 12 komputerowymi regałami i 4 przełączonymi przełącznikami sieciowymi, do rozliczeniowej NVIDIA. href=”https://pytorchToatoms.substack.com/p/why-dgx-h100-nvl256-Never-shisped”Target=”_ blank”> dgx h100 NVL256 „Ranger” platforma
, która również zawierała dużą, optycznie połączoną wielo-rack design zbyt złożoną i kosztowną dla produkcji. > Prowadzenie sankcji Maze
Powstała łączna wewnętrzna przepustowość przewyższa 5,5 PBP. Semianaliza oblicza system oferuje 2,1-krotność szerokości pasma w skali (w klastrze 384-węzłowym) i 5,3 razy większą szerokość pasma (do łączenia wielu klastrów) w porównaniu z niedźwiedziami GB200 NVL72.
Ogólny projekt 16-tańczycy, z 12 komputerowymi regałami i 4 przełączonymi przełącznikami sieciowymi, do rozliczeniowej NVIDIA. href=”https://pytorchToatoms.substack.com/p/why-dgx-h100-nvl256-Never-shisped”Target=”_ blank”> dgx h100 NVL256 „Ranger” platforma
, która również zawierała dużą, optycznie połączoną wielo-rack design zbyt złożoną i kosztowną dla produkcji. > Prowadzenie sankcji MazeWykonanie tej strategii zależy od zabezpieczenia zaawansowanych komponentów pomimo rygorystycznych kontroli eksportu w USA. Podczas gdy SMIC Chin może wytwarzać układy klasy 7Nm odpowiednie dla chipletów obliczeniowych 910C, analiza sugeruje, że procesory rozmieszczone do tej pory wykorzystują przede wszystkim chiplety sfabrykowane przez TSMC.
Huawei, które rzekomo zabezpieczały te ograniczone palety-potencjalnie wystarczająco na ponad milion procesorów 910c do 2025 r.-Półmemites, takich jak SophGo, obrzezanie bezpośrednio przeciwko temu. Huawei. Aktywność ta podobno doprowadziła do zachowania USA, przy czym TSMC potencjalnie stanęła w obliczu znaczącej grzywny, jak donosi na początku kwietnia.
Dostęp do niezbędnej pamięci HBM2E obejmuje podobne obrażenia, kierowanie komponentami Samsunga za pośrednictwem technologii faraday za pośrednictwem technologii dystrybutora COASIA, którego przychody noticeaareaveaveaveaveavearesme. Pakiety pośrednie zawierające HBM, które są następnie wysyłane do Chin, gdzie pamięć jest rzekomo wyodrębniana do użytku w końcowych modułach Huawei 910C. Manewry te podkreślają ciągłe wyzwanie egzekwowania technologii kontroli eksportu.
obliczony hazard w chińskiej rasie AI
Uruchomienie Cloudmatrix 384 jest strategicznie określone. Działanie amerykańskie zatrzymywanie eksportu NVIDIA H20 usunęło kluczowego konkurenta specjalnie dostosowanego do chińskiego rynku zgodnie z poprzednimi ograniczeniami. H20, choć część niższa w porównaniu z nieograniczonym GPU NVIDIA i potencjalnie Huawei wcześniej 910B Chip, był główną ofertą zgodną z Nvidia dla Chin, a zakaz zmusił spółkę do przejęcia opłaty za 5,5 miliarda dolarów za powiązaną inwentaryzację.
Ta regulacyjna zmiana stworzyła otwarcie rynkowe, które Huawei przeprowadziło do wypełnienia nie tylko w chmurze, nie tylko jej inwentaryzacji.
Jednocześnie ogłosił Chip Next Gen Ascend 920.
Sytuacja skłoniła dyrektor generalny NVIDIA Jensen Huang do Odwiedź Pekin Krótko po zakazie, gdzie podobno stwierdził, że Nvidia miał nadzieję „kontynuować współpracę z Chinami.”
Analityk Patrick Moorhead przewidział wynik: „Chińskie firmy po prostu przejdą na Huawei”. Jest to zgodne z szerszymi chińskimi celami technologicznymi, widocznymi w inicjatywach takich jak phase-o-ochodzenie zagranicznej terecom chips i zasadnicze fundusz „wielkie”. rozwój. CloudMatrix 384 Huawei pokazuje teraz ścieżkę do konkurencyjnej wydajności systemu AI, akceptując większą moc, nawigując złożonym globalnym łańcuchem dostaw pod ograniczeniami geopolitycznymi.