Chiński start-up zajmujący się sztuczną inteligencją (AI) DeepSeek wstrząsa fundamentami światowych rynków technologii, podając w wątpliwość zawyżone wyceny amerykańskich gigantów technologicznych.

Firmowy model R1, wprowadzony na rynek 10 stycznia, udowodnił, że konkurencyjne systemy sztucznej inteligencji można opracować przy ułamku zasobów zwykle wymaganych przez liderów branży.

To spowodowało, że kontrakty terminowe Nasdaq 100 spadły w poniedziałek o ponad 5%. Gdy inwestorzy zmagają się z konsekwencjami, niektórzy zadają palące pytanie: czy DeepSeek właśnie przebił bańkę na amerykańskiej giełdzie technologicznej?

Nvidia, dziecko z plakatu Boom na sztuczną inteligencję, zaobserwował swoje akcje spadły o ponad 13% w handlu przed otwarciem sesji.

U podstaw tego przełomu leży rewolucyjna wydajność DeepSeek R1. W przeciwieństwie do modeli opracowanych przez OpenAI i Meta, które opierają się na kosztownym, wysokowydajnym sprzęcie, R1 osiągnął porównywalną wydajność dzięki procesorom graficznym Nvidia H800 – chipom niższej klasy objętym ograniczeniami amerykańskimi sankcjami.

Powiązane: Jak DeepSeek R1 przewyższa ChatGPT o1 w ramach sankcji, redefiniując wydajność sztucznej inteligencji przy użyciu zaledwie 2048 procesorów graficznych

To osiągnięcie zniweczyło wieloletnie założenia o konieczności poniesienia ogromnych wydatków na infrastrukturę w rozwoju sztucznej inteligencji i wzbudziła nowe obawy dotyczące trwałości modelu biznesowego Doliny Krzemowej.

DeepSeek R1: opłacalny konkurent dla Doliny Krzemowej

Model R1 firmy DeepSeek to kamień milowy w innowacji w zakresie sztucznej inteligencji, który szybko wspiął się na pierwsze miejsce w amerykańskim sklepie Apple App Store zaledwie kilka dni po premierze. Oferując przejrzystość procesów rozumowania, aplikacja została doceniona za zdolność do skutecznego rozwiązywania złożonych zapytań. Opinie użytkowników podkreślają jego dostępność i niezawodność, kontrastując z podejściem wymagającym dużych zasobów stosowanym przez amerykańskie odpowiedniki.

Model został wyszkolony przy użyciu 2048 procesorów graficznych Nvidia H800, a jego łączny koszt wyniósł niecałe 6 milionów dolarów, zgodnie z badaniem z grudnia 2024 r. artykuł badawczy opublikowany przez DeepSeek. Te procesory graficzne, celowo zaprojektowane z ograniczonymi możliwościami w celu spełnienia amerykańskich ograniczeń eksportowych, stwarzały wyjątkowe wyzwania.

Jednak inżynierowie DeepSeek opracowali nowatorskie techniki optymalizacji w celu zminimalizowania wymagań obliczeniowych i pamięci, osiągając testy wydajności na poziomie 97,3% w przypadku MATH-500 i 79,8% w przypadku AIME 2024.

Założyciel Liang Wenfeng, były menadżer funduszy hedgingowych tak opisał strategię firmy: „Szacujemy, że najlepsze modele krajowe i zagraniczne mogą mieć jednokrotną lukę w strukturze modeli i szkoleniu dynamika. Z tego powodu, aby osiągnąć ten sam efekt, musimy zużyć czterokrotnie większą moc obliczeniową. Musimy stale zmniejszać te luki” [36Kr].

Efekty fali na rynkach światowych

Wypuszczenie R1 spowodowało gwałtowną wyprzedaż na rynku globalne akcje spółek technologicznych Nvidia, której procesory graficzne są powszechnie uważane za niezbędne w rozwoju sztucznej inteligencji, odnotowała miliardowy spadek wyceny.

Europejski producent chipów ASML Holding NV również odnotowała 11% spadek, podczas gdy kontrakty terminowe Nasdaq 100 odnotowały wolumen obrotu czterokrotnie większy od średniej dziennej już w poniedziałek inwestorzy ponownie oceniają sytuację finansową sektora sztucznej inteligencji, który w zeszłym roku spowodował znaczny wzrost wartości akcji spółek technologicznych.

Skutki wykraczają poza USA, z Chinami Akcje związane ze sztuczną inteligencją, takie jak Merit Interactive Co. zyskała aż 20% w odpowiedzi na sukces DeepSeek. Indeks Hang Seng Tech wzrósł przed Księżycowym Nowym Rokiem, odzwierciedlając optymizm co do rosnącej obecności Chin w innowacjach AI.

Wymiar geopolityczny: sankcje i innowacje

Rozwój DeepSeek jest bezpośrednią reakcją na amerykańskie kontrole eksportu mające na celu ograniczenie dostępu Chin do zaawansowanych technologii. Od 2021 r. ograniczenia te mają na celu zapobieganie rozwojowi konkurencyjnych systemów sztucznej inteligencji w Chinach poprzez ograniczanie dostępu do najnowocześniejszego sprzętu.

Jednak pomysłowe wykorzystanie procesorów graficznych H800 przez firmę DeepSeek pokazało, że innowacje mogą rozwijać się nawet w warunkach rygorystycznych ograniczenia.

Strategia Lianga polegająca na gromadzeniu zapasów procesorów graficznych objętych ograniczeniami, zanim sankcje wejdą w życie w pełni, była kluczowa. Koncentrując się na wydajności, a nie na brutalnej mocy obliczeniowej, inżynierowie DeepSeek pokazali, jak ograniczenia mogą sprzyjać kreatywnemu rozwiązywaniu problemów.

Yann LeCun, główny specjalista ds. sztucznej inteligencji w firmie Meta, pochwalił etos open source leżący u podstaw rozwoju R1, stwierdzając: „DeepSeek czerpie korzyści z otwartych badań i otwartego oprogramowania (np. PyTorch i Llama firmy Meta). Wpadli na nowe pomysły i opracowali je w oparciu o prace innych osób.”

Implikacje dla amerykańskich gigantów technologicznych

Sukces modelu R1 firmy DeepSeek stwarza niewygodne pytania do amerykańskich liderów technologicznych, takich jak Meta i Microsoft, które zainwestowały miliardy w infrastrukturę sztucznej inteligencji Mark Zuckerberg, dyrektor generalny Meta, przedstawił niedawno ambitne plany firmy dotyczące wdrożenia ponad 1,3 miliona procesorów graficznych 2025, stwierdzając: „Planujemy w tym roku zainwestować 60–65 miliardów dolarów w nakłady inwestycyjne, jednocześnie znacząco powiększając nasze zespoły ds. sztucznej inteligencji, a także mamy kapitał, aby kontynuować inwestycje w nadchodzących latach”.

Nowa era innowacji w zakresie sztucznej inteligencji

Zaangażowanie firmy DeepSeek we współpracę w zakresie open source wyróżnia ją na tle gigantów branży. Publikując architekturę i metody szkoleniowe R1, firma umożliwiła programistom na całym świecie replikowanie lub ulepszanie jego pracy.

Ta przejrzystość kontrastuje z zastrzeżonym charakterem platform takich jak ChatGPT OpenAI, podkreślając potencjalne przejście w kierunku bardziej dostępnych innowacji w zakresie sztucznej inteligencji.

Osiągnięcia DeepSeek przypominają, że przywództwo technologiczne nie jest definiowane wyłącznie przez zasoby finansowe. Niezależnie od tego, czy oznacza to koniec bańki na amerykańskiej giełdzie technologicznej, czy też nowy rozdział w globalnej konkurencji w zakresie sztucznej inteligencji, jedno jest jasne: zmieniają się zasady gry.

Categories: IT Info