A Huawei introduziu seu sistema AI CloudMatrix 384, um cluster em larga escala projetado para competir diretamente com a arquitetura líder da NVIDIA GB200 NVL72, implantando um número substancial de seus processadores ASCEND 910C. Anunciado logo após o governo dos EUA restringir efetivamente as exportações do chip AI H20 da NVIDIA para a China por volta de 15 de abril, o CloudMatrix 384 representa uma alternativa doméstica com o objetivo de preencher o vazio. href=”https://www.nvidia.com/en-us/data-center/gb200-nvl72/”target=”_ Blank”> gb200 nvl72 Sistema em várias áreas, mas o mesmo que o SMETMENTO PENLIGUNDO. 910C, um processador de dual-chiplet que fornece 780 tflops usando o formato numérico BF16 comum na IA. O cluster Full CloudMatrix 384 integra 384 desses aceleradores e

Essa vantagem de desempenho, alcançada ao implantar mais de cinco vezes mais aceleradores que o sistema de comparação da NVIDIA, tem um custo acentuado de energia. O requisito de energia total do sistema do CloudMatrix 384 é estimado em 559 kW, quase quatro vezes o 145 kW consumido pela configuração GB200 NVL72.

Os cálculos com base nessas figuras indicam que o sistema huawei é menos de 2,3 vezes e eficiência de potência de BF16 e 1.3 vezes o sistema de composição de BF16 e 1.3 vezes a computação de BF16 e 1.3 vezes eficiente de BF16 e 1.3 vezes A eficiência por terabyte da capacidade HBM está mais próxima, com o sistema da Huawei usando cerca de 1,1 vezes mais energia. Os preços da eletricidade em partes da China diminuíram notavelmente, supostamente Níveis anteriores próximos a US $ 91/mwh em 2022 , tornando os sistemas de power-hungry mais economicamente viáveis ​​do que podem estar em outros lugares. Para permitir que esse cluster em larga escala é a arquitetura de rede do CloudMatrix 384. A Huawei optou por uma abordagem totalmente óptica para comunicação entre rack e intra-rack, conectando os 384 processadores ASCEND 910C em uma malha tudo para tudo. Isso envolve a implantação de um enorme transceptores lineares de óptica linear (LPO), cada um operando a 800 gbps. href=”https://www.lightcounting.com/resource/42/resourcefile/research%20Note%20on%20LPO%20Webinar%20092923.pdf”alvo=”_”Blanks d’tumbers , é visto como um potencialmente Algumas economias de energia dentro do próprio tecido da rede, embora o gerenciamento da integridade do sinal em uma rede óptica tão grande e complexa apresenta seus próprios desafios. A múmica calcula o sistema Oferece 2,1 vezes a largura de banda de expansão (dentro do cluster de 384 nós) e 5,3 vezes a largura de banda de escala (para conectar vários clusters) em comparação com a linha de base GB200 NVL72. href=”https://pytorchtoatoms.substack.com/p/why-dgx-h100-nvl256-never-se enviado”Target=”_ Blank”> dgx h100 nvl256″ranger”plataforma , o que também possui um design de Multi-RACK/ATTION, que também possui um grande, com um tempo <. > Navegando pelo labirinto de sanções

executar essa estratégia depende de garantir componentes avançados, apesar dos rigorosos controles de exportação dos EUA. Embora o SMIC da China possa produzir chips de classe de 7 nm adequados para os chiplets de computação do Ascend 910C, a análise sugere que os processadores implantados até agora utilizam principalmente os chipets fabricados por TSMC. Huawei. Essa atividade supostamente levou ao escrutínio dos EUA, com o TSMC potencialmente enfrentando uma multa significativa, conforme relatado no início de abril. Pacotes intermediários que contêm o HBM, que são enviados para a China, onde a memória é supostamente extraída para uso nos módulos finais 910C de Ascend 910c da Huawei. Essas manobras ressaltam o desafio contínuo de cumprir os controles de exportação de tecnologia. A ação dos EUA interrompeu as exportações da NVIDIA H20 removeu um concorrente-chave especificamente adaptado ao mercado chinês sob restrições anteriores. O H20, embora uma parte de menor desempenho em comparação com as GPUs NVIDIA irrestritas e o chip 910b anterior da Huawei, foi a principal oferta compatível com a Nvidia para a China, e a proibição forçou a empresa a não ter uma carga de US $ 5,5 bilhões para o estoque relacionado. anunciou simultaneamente o próximo gênero 920 Chip. Target=”_ Blank”> Visite Pequim Logo após a proibição, onde ele afirmou que a Nvidia esperava “continuar a cooperar com a China.”

O analista Patrick Moorhead previu o resultado sem rodeios: “as empresas chinesas vão mudar para a Huawei”. Isso se alinha com objetivos de tecnologia chinesa mais amplos, vistos em iniciativas como a Fase-Out da fase de telecas O CloudMatrix 384 da Huawei mostra um caminho para o desempenho do sistema de IA competitivo agora, aceitando maior uso de energia enquanto navega em uma complexa cadeia de suprimentos global sob restrições geopolíticas.