Nvidia podobno rozważa modyfikacje techniczne H20 w celu spełnienia, zgodnie z wcześniejszym raportowaniem. Jednak zmiana układu może zmniejszyć jego wydajność i wpłynąć na jego konkurencyjność w stosunku do już zoptymalizowanych lokalnych alternatyw.
H20Piling oparte na Deepseek AI
Niedawny wzrost popytu na H20 nie był spontaniczny. W dużej mierze spowodowało to wzrost AI Deepseek, który szybko zyskał przyczepność tej zimy jako chińskiego rywala do Openai.
Wraz ze wzrostem wykorzystania Deepseek na platformach przedsiębiorstw, firmy starały się zabezpieczyć siłę obliczeniową potrzebną do uruchomienia obciążeń dotyczących wnioskowania i treningu modelu. To Scramble zmieniło się w szaleństwo z zapasami, ponieważ firmy rzuciły się na jak najwięcej układów H20, zanim pojawiły się dalsze ograniczenia eksportowe.
Waszyngton po raz pierwszy zakazał GPU Nvidia A100 i H100 GPU w październiku 2022 r., Powołując się na obawy dotyczące bezpieczeństwa narodowego. NVIDIA odpowiedziała, wprowadzając podnośniki A800 i H800-podniosły podnośniki, które później stanęły w obliczu własnych zakazów pod koniec 2023 r. H20 pojawiło się jako ostateczne obejście. Ale nawet to okno może się zamykać.
26 marca, na dzień przed alertem H3C, Departament Handlu USA ponownie rozszerzył ograniczenia eksportowe AI, dodając dziesiątki chińskich firm do listy podmiotów. Wśród nich było sześć spółek zależnych grupy Inspur, głównego klienta NVIDIA. Ten ruch, wraz z zaostrzonym licencjonowaniem sprzętu AI, podnosi prawdopodobieństwo, że nawet układy H20 wkrótce będą wymagały zatwierdzeń eksportowych w przypadku przypadku-jeśli w ogóle są dozwolone.
Nvidia ostrzega, że jeśli H20 zostanie dodany do czarnej liście eksportu w USA, wyeliminuje to ostatnia sprzedaż chipów w Chinach. Strategie AI
Nawet najlepsi klienci NVIDIA zastawiają swoją zależność od sprzętu. Tencent, jeden z największych chińskich konglomeratów technologicznych, ujawniony podczas zysków z 2024 r. Zwołał, że zaczął optymalizować infrastrukturę AI, przyjmując bardziej wydajne modele Deepseek. Te nowe architektury zostały zaprojektowane w celu zmniejszenia polegania na GPU przy jednoczesnym zachowaniu wydajności zadań takich jak szkolenie i wnioskowanie.
Według głównego oficera strategii firmy: „Otrzymujemy znacznie wyższą wydajność podczas treningu modelu dużego języka z istniejących procesorów graficznych, nie trzeba dodać dodatkowego procesora graficznego w tempie”. To stwierdzenie odzwierciedla szerszą zmianę branżową w kierunku strategii obliczeniowych zorientowanych na wydajność.
Podczas gdy Tencent złożył znaczne zamówienia H20 na wsparcie integracji modelu Deepeek w platformach takich jak WeChat, jego długoterminowy kierunek faworyzuje mniejsze modele, specjalizacja architektoniczna i lokalne pozyskiwanie.
, utrzymują się ograniczenia infrastrukturalne. Na początku lutego Deepseek tymczasowo zatrzymał się w uzupełnieniu API z powodu przytłaczającego ruchu, podkreślając prawdziwe obciążenie kręgosłupa obliczeniowego Chin, jak wcześniej informowano.
Kompromis konkurencyjności związanej z zgodnością
H20 jest zbudowany z conpromise. Po wcześniejszych zakazach w swoim flagowym procesorze graficznym AI, NVIDIA zaprojektowała H20, aby spadnie poniżej progów eksportowych w USA, jednocześnie zaspokajając kluczowe potrzeby klientów. Ale czyniąc to, pozostawiło się otwarte na inny rodzaj ściśnięcia regulacyjnego-narzuconego z granic chińskiego.
, gdy Pekin dążył do zmniejszenia emisji z centrów danych i przesunięcia zamówień na sprzęt zoptymalizowany energetycznie, Nvidia uważa, że sprzedaż produktu, który może być już politycznie lub w handlu. W tym samym czasie zaostrzone uchwyt Waszyngtonu w zakresie zgodności z eksportem może stłumić wszelkie wysiłki na rzecz zmiany układu w celu lepszej wydajności lub wydajności.
Chińczycy decydenci również zmniejszają się na pośrednich trasach akwizycji chipów. Raporty z wielu źródeł potwierdzają, że USA naciskają kraje sojusznicze, takie jak Holandia i Japonia, aby ograniczyć obsługę i wsparcie dla narzędzi do robienia wiewiieru, takich jak maszyny litograficzne ASML Duv, które są nadal szeroko stosowane w Chinach.
Nvidia nadal generują przychody od chińskich klientów AI na razie. Ale ta pozycja jest stale erodowana przez geopolitykę, mandaty polityczne i rosnące preferencje dla domowych alternatyw. To, co kiedyś wyglądało na sprytne obejście regulacyjne, jest teraz zderzające się z krajobrazem politycznym, który jest coraz bardziej nietolerancyjny dla kompromisu.