Ang artificial intelligence (AI) startup ng China na DeepSeek ay nanginginig ang mga pundasyon ng mga pandaigdigang tech market, na nagtatanong sa tumataas na mga valuation ng mga higante sa teknolohiya ng U.S.
Ang modelo ng R1 ng kumpanya, na inilabas noong Enero 10, ay napatunayan na ang mga mapagkumpitensyang AI system ay maaaring mabuo gamit ang isang fraction ng mga mapagkukunan na karaniwang kinakailangan ng mga pinuno ng industriya.
Nagpadala ito ng Nasdaq 100 futures na bumagsak nang higit sa 5% noong Lunes. Habang ang mga namumuhunan ay nakikipagbuno sa mga implikasyon, ang ilan ay nagtatanong ng isang matinding tanong: Ang DeepSeek ba ay sumabog lamang sa U.S. tech stock market bubble?
Nvidia, ang poster na anak ng AI boom, nakitang bumagsak ang mga bahagi nito nang higit sa 13% sa premarket trading.
Sa kaibuturan ng kaguluhan ay ang rebolusyonaryong kahusayan ng DeepSeek R1. Hindi tulad ng mga modelong binuo ng OpenAI at Meta na umaasa sa magastos at mataas na pagganap ng hardware, nakamit ng R1 ang maihahambing na pagganap gamit ang mga H800 GPU ng Nvidia—mga chip na may mababang antas na pinaghihigpitan ng mga parusa ng U.S.
Kaugnay: Paano Nalalampasan ng DeepSeek R1 ang ChatGPT o1 Sa ilalim ng Mga Sanction, Muling Tinutukoy ang AI Efficiency Gamit ang 2,048 GPU Lamang
Ang tagumpay na ito ay nakagambala sa mga matagal nang pagpapalagay tungkol sa pangangailangan ng napakalaking paggastos sa imprastraktura sa pagpapaunlad ng AI at nagtaas ng mga bagong alalahanin tungkol sa pagpapatuloy ng modelo ng negosyo ng Silicon Valley.
DeepSeek R1: A Cost-Effective Challenger sa Silicon Valley
Ang modelong R1 ng DeepSeek ay isang milestone sa AI innovation, mabilis na umakyat sa tuktok na lugar sa Apple’s U.S. App Store ilang araw lang matapos itong ilabas. Nag-aalok ng transparency sa mga proseso ng pangangatwiran nito, ang app ay pinuri para sa kakayahang malutas ang mga kumplikadong query nang mahusay. Binibigyang-diin ng mga review ng user ang pagiging naa-access at pagiging maaasahan nito, na naiiba sa mga diskarteng masinsinang mapagkukunan na ginawa ng mga katapat sa U.S.
Ang modelo ay sinanay gamit ang 2,048 Nvidia H800 GPU sa kabuuang halaga na wala pang $6 milyon, ayon sa isang Disyembre 2024 research paper na inilabas ng DeepSeek. Ang mga GPU na ito, na sadyang idinisenyo nang may pinababang mga kakayahan upang sumunod sa mga paghihigpit sa pag-export ng U.S., ay nagpakita ng mga natatanging hamon.
Gayunpaman, ang mga inhinyero ng DeepSeek ay nakabuo ng mga bagong diskarte sa pag-optimize upang mabawasan ang computational at mga kinakailangan sa memorya, na nakakamit ang mga benchmark ng pagganap na 97.3% sa MATH-500 at 79.8% sa AIME 2024.
Founder Liang Wenfeng, isang dating hedge fund manager, na inilarawan ang diskarte ng kumpanya: “Tinatantya namin na ang pinakamahusay na domestic at foreign model ay maaaring magkaroon ng agwat ng isang beses sa istraktura ng modelo at dynamics ng pagsasanay. Para sa kadahilanang ito, kailangan nating gumamit ng apat na beses na mas maraming kapangyarihan sa pag-compute upang makamit ang parehong epekto. Ang kailangan nating gawin ay patuloy na paliitin ang mga puwang na ito”[36Kr].
Mga Ripple Effects sa Buong Global Markets
Ang paglabas ng R1 ay nag-trigger ng matinding selloff sa Ang mga stock ng pandaigdigang tech na Nvidia, na ang mga GPU ay malawak na itinuturing na mahalaga sa pagpapaunlad ng AI, ay nakakita ng pagbaba ng halaga nito ng bilyun-bilyon
Naranasan din ng European chipmaker na ASML Holding NV 11% na bumaba, habang ang Nasdaq 100 futures ay nagtala ng mga volume ng kalakalan ng apat na beses sa pang-araw-araw na average sa unang bahagi ng Lunes Ang mga mamumuhunan ay muling sinusuri ang mga pinansiyal na pinagbabatayan ng sektor ng AI, na nagtulak ng makabuluhang paglago sa mga tech na stock sa nakaraang taon.
The Geopolitical Dimension: Sanctions and Innovation
Ang pagtaas ng DeepSeek ay isang direktang tugon sa mga kontrol sa pag-export ng U.S. na idinisenyo upang limitahan ang pag-access ng China sa mga advanced na teknolohiya. Mula noong 2021, ang mga paghihigpit na ito ay naglalayong pigilan ang pagbuo ng mga mapagkumpitensyang AI system sa China sa pamamagitan ng paghihigpit sa pag-access sa cutting-edge na hardware. Gayunpaman, ang mapamaraang paggamit ng DeepSeek ng mga H800 GPU ay nagpakita na ang inobasyon ay maaaring umunlad kahit na sa ilalim ng mahigpit na mga hadlang.
Ang diskarte ni Liang sa pag-iimbak ng mga pinaghihigpitang GPU bago ang mga parusa ay ganap na naging epektibo. Sa pamamagitan ng pagtutok sa kahusayan sa halip na malupit na computational power, ipinakita ng mga inhinyero ng DeepSeek kung paano nagagawa ng mga hadlang ang malikhaing paglutas ng problema. Pinuri ni Yann LeCun, ang Chief AI Scientist ng Meta, ang open-source ethos sa likod ng pag-unlad ng R1, na nagsasaad:”Ang DeepSeek ay binuo sa gawa ng iba habang nag-aambag ng mga bagong ideya, na nagpapakita ng halaga ng bukas na pananaliksik.”
Mga implikasyon para sa U.S. Tech Giants
Ang tagumpay ng R1 na modelo ng DeepSeek ay nagdudulot ng mga hindi komportableng tanong para sa U.S. Ang mga pinuno ng teknolohiya tulad ng Meta at Microsoft, na nag-invest ng bilyun-bilyon sa imprastraktura ng AI na si Mark Zuckerberg ay binalangkas kamakailan ang mga ambisyosong plano ng kumpanya na mag-deploy ng higit sa 1.3 milyong mga GPU sa 2025, na nagsasabing: “Pinaplano naming mag-invest ng $60-65 bilyon ngayong capex. taon habang pinalalaki nang malaki ang aming mga AI team.”
Isang Bagong Era para sa AI Innovation
Ang pangako ng DeepSeek sa open-source na pakikipagtulungan ay nagbukod nito sa mga higante sa industriya. Sa pamamagitan ng pag-publish ng mga pamamaraan ng arkitektura at pagsasanay ng R1, binibigyang-daan ng kumpanya ang mga developer sa buong mundo na kopyahin o pahusayin ang gawain nito. Ang transparency na ito ay kaibahan sa pagmamay-ari ng mga platform tulad ng OpenAI’s ChatGPT, na nagha-highlight ng potensyal na pagbabago tungo sa mas naa-access na AI innovation.
Habang tumitindi ang AI race, ang mga nagawa ng DeepSeek ay isang paalala na ang teknolohikal na pamumuno ay hindi lamang tinukoy ng pananalapi. mapagkukunan. Minarkahan man nito ang pagtatapos ng bula ng tech na stock market ng U.S. o isang bagong kabanata sa pandaigdigang kumpetisyon sa AI, isang bagay ang malinaw: nagbabago ang mga panuntunan ng laro.