La startup cinese di intelligenza artificiale (AI) DeepSeek sta scuotendo le fondamenta dei mercati tecnologici globali, mettendo in discussione le valutazioni gonfiate dei giganti tecnologici statunitensi.

Il modello R1 dell’azienda, rilasciato il 10 gennaio, ha dimostrato che è possibile sviluppare sistemi di intelligenza artificiale competitivi con una frazione delle risorse tipicamente richieste dai leader del settore.

Ciò ha fatto crollare i futures sul Nasdaq 100 lunedì di oltre il 5%. Mentre gli investitori sono alle prese con le implicazioni, alcuni si pongono una domanda urgente: DeepSeek ha appena fatto scoppiare la bolla del mercato azionario tecnologico statunitense?

Nvidia, la figlia simbolo del Boom dell’intelligenza artificiale, ha visto le sue azioni crollare più del 13% nel trading pre-mercato.

Al centro dello sconvolgimento c’è l’efficienza rivoluzionaria di DeepSeek R1. A differenza dei modelli sviluppati da OpenAI e Meta che si basano su hardware costoso e ad alte prestazioni, R1 ha raggiunto prestazioni comparabili utilizzando le GPU H800 di Nvidia, chip di qualità inferiore limitati dalle sanzioni statunitensi.

Correlati: In che modo DeepSeek R1 supera ChatGPT o1 sotto sanzioni, ridefinendo l’efficienza dell’intelligenza artificiale utilizzando solo 2.048 GPU

Questo risultato ha sconvolto le ipotesi di lunga data sulla necessità di ingenti spese infrastrutturali per lo sviluppo dell’intelligenza artificiale e ha sollevato nuove preoccupazioni sulla sostenibilità del modello di business della Silicon Valley.

DeepSeek R1: una sfida economicamente vantaggiosa per la Silicon Valley

Il modello R1 di DeepSeek è una pietra miliare nell’innovazione dell’intelligenza artificiale, scalando rapidamente il primo posto nell’App Store statunitense di Apple pochi giorni dopo il suo rilascio. Offrendo trasparenza nei suoi processi di ragionamento, l’app è stata elogiata per la sua capacità di risolvere query complesse in modo efficiente. Le recensioni degli utenti ne evidenziano l’accessibilità e l’affidabilità, in contrasto con gli approcci ad uso intensivo di risorse adottati dalle controparti statunitensi.

Il modello è stato addestrato utilizzando 2.048 GPU Nvidia H800 per un costo totale inferiore a 6 milioni di dollari, secondo un sondaggio del dicembre 2024. documento di ricerca pubblicato da DeepSeek. Queste GPU, progettate intenzionalmente con capacità ridotte per conformarsi alle restrizioni sulle esportazioni statunitensi, presentavano sfide uniche.

Tuttavia, gli ingegneri di DeepSeek hanno sviluppato nuove tecniche di ottimizzazione per ridurre al minimo i requisiti di calcolo e di memoria, raggiungendo benchmark prestazionali del 97,3% su MATH-500 e del 79,8% su AIME 2024.

Il fondatore Liang Wenfeng, un ex manager di hedge fund, ha descritto la strategia dell’azienda: “Stimiamo che i migliori modelli nazionali ed esteri possano presentare un divario pari a una volta nella struttura del modello e nelle dinamiche di formazione. Per questo motivo, per ottenere lo stesso effetto, dobbiamo consumare quattro volte più potenza di calcolo. Ciò che dobbiamo fare è ridurre costantemente questi divari”[36Kr].

Effetti a catena sui mercati globali

Il rilascio di R1 ha innescato una forte svendita in i titoli tecnologici globali, Nvidia, le cui GPU sono ampiamente considerate essenziali per lo sviluppo dell’intelligenza artificiale, hanno visto la loro valutazione scendere di miliardi

produttore europeo di chip Anche ASML Holding NV ha subito un calo dell’11%, mentre i futures Nasdaq 100 hanno registrato volumi di scambi quattro volte la media giornaliera entro l’inizio di lunedì gli investitori stanno rivalutando le basi finanziarie del settore dell’intelligenza artificiale, che ha guidato una crescita significativa dei titoli tecnologici nell’ultimo anno.

Le conseguenze si estendono oltre gli Stati Uniti, con la Cina Titoli legati all’intelligenza artificiale come Merit Interactive Co. è cresciuta fino al 20% in risposta al successo di DeepSeek. L’indice Hang Seng Tech è cresciuto prima del Capodanno lunare, riflettendo ottimismo sulla crescente presenza della Cina nell’innovazione dell’intelligenza artificiale.

La dimensione geopolitica: sanzioni e innovazione

L’ascesa di DeepSeek è una risposta diretta ai controlli sulle esportazioni statunitensi progettati per limitare l’accesso della Cina alle tecnologie avanzate. Dal 2021, queste restrizioni mirano a impedire lo sviluppo di sistemi di intelligenza artificiale competitivi in ​​Cina limitando l’accesso a hardware all’avanguardia.

Tuttavia, l’uso ingegnoso delle GPU H800 da parte di DeepSeek ha dimostrato che l’innovazione può prosperare anche in condizioni rigorose. vincoli.

La strategia di Liang di accumulare GPU soggette a restrizioni prima che le sanzioni entrassero in vigore è stata fondamentale. Concentrandosi sull’efficienza piuttosto che sulla potenza computazionale bruta, gli ingegneri di DeepSeek hanno dimostrato come i vincoli possano guidare la risoluzione creativa dei problemi.

Yann LeCun, capo scienziato AI di Meta, ha elogiato l’etica open source dietro lo sviluppo di R1, affermando:”DeepSeek ha tratto profitto dalla ricerca aperta e dall’open source (ad esempio, PyTorch e Llama di Meta). Hanno avuto nuove idee e le hanno sviluppate basandosi sul lavoro di altre persone.”

Implicazioni per i giganti tecnologici statunitensi

Il successo del modello R1 di DeepSeek pone domande scomode per i leader tecnologici statunitensi come Meta e Microsoft, che hanno investito miliardi nell’infrastruttura AI, Mark Zuckerberg, CEO di Meta, ha recentemente delineato i piani ambiziosi dell’azienda per l’implementazione di oltre 1,3 milioni di GPU 2025, affermando:”Quest’anno prevediamo di investire 60-65 miliardi di dollari in spese di capitale, facendo crescere significativamente i nostri team di intelligenza artificiale e disponiamo del capitale per continuare a investire negli anni a venire.”

Una nuova era per l’innovazione dell’intelligenza artificiale

L’impegno di DeepSeek nella collaborazione open source lo ha distinto dai giganti del settore. Pubblicando l’architettura e i metodi di formazione di R1, l’azienda ha consentito agli sviluppatori di tutto il mondo di replicare o migliorare il proprio lavoro.

Questa trasparenza contrasta con la natura proprietaria di piattaforme come ChatGPT di OpenAI, evidenziando un potenziale spostamento verso un’innovazione IA più accessibile.

I risultati di DeepSeek ricordano che la leadership tecnologica non è definita esclusivamente da risorse finanziarie. Che questo segnerà la fine della bolla del mercato azionario tecnologico statunitense o l’apertura di un nuovo capitolo nella competizione globale sull’intelligenza artificiale, una cosa è chiara: le regole del gioco stanno cambiando.

Categories: IT Info