La start-up chinoise d’intelligence artificielle (IA) DeepSeek ébranle les fondations des marchés technologiques mondiaux, remettant en question les valorisations exagérées des géants technologiques américains.

Le modèle R1 de l’entreprise, publié le 10 janvier, a prouvé que des systèmes d’IA compétitifs peuvent être développés avec une fraction des ressources généralement requises par les leaders du secteur.

Cela a fait chuter les les contrats à terme du Nasdaq 100 de plus de 5 % lundi. Alors que les investisseurs sont aux prises avec les implications, certains se posent une question urgente : DeepSeek vient-il de faire éclater la bulle boursière technologique américaine ?

Nvidia, l’enfant emblématique du Boom de l’IA, a vu ses actions chuter davantage de plus de 13 % lors des échanges avant commercialisation.

Au cœur du bouleversement se trouve l’efficacité révolutionnaire de DeepSeek R1. Contrairement aux modèles développés par OpenAI et Meta qui reposent sur du matériel coûteux et hautes performances, le R1 a atteint des performances comparables en utilisant les GPU H800 de Nvidia, des puces de qualité inférieure restreintes par les sanctions américaines.

Connexe : Comment DeepSeek R1 surpasse ChatGPT o1 sous sanctions, redéfinissant l’efficacité de l’IA en utilisant seulement 2 048 GPU

Cette réalisation a bouleversé des hypothèses de longue date sur la nécessité de dépenses d’infrastructure massives dans le développement de l’IA et a soulevé de nouvelles inquiétudes quant à la durabilité du modèle économique de la Silicon Valley.

DeepSeek R1 : un challenger rentable pour la Silicon Valley

Le modèle R1 de DeepSeek constitue une étape importante dans l’innovation en matière d’IA, se hissant rapidement à la première place sur l’App Store américain d’Apple quelques jours seulement après sa sortie. Offrant de la transparence dans ses processus de raisonnement, l’application a été saluée pour sa capacité à résoudre efficacement des requêtes complexes. Les avis des utilisateurs soulignent son accessibilité et sa fiabilité, contrastant avec les approches gourmandes en ressources adoptées par ses homologues américains.

Le modèle a été formé à l’aide de 2 048 GPU Nvidia H800 pour un coût total inférieur à 6 millions de dollars, selon une étude de décembre 2024. document de recherche publié par DeepSeek. Ces GPU, intentionnellement conçus avec des capacités réduites pour se conformer aux restrictions américaines sur les exportations, présentaient des défis uniques.

Pourtant, les ingénieurs de DeepSeek ont ​​développé de nouvelles techniques d’optimisation pour minimiser les besoins en calcul et en mémoire, atteignant des tests de performances de 97,3 % sur MATH-500 et de 79,8 % sur AIME 2024.

Le fondateur Liang Wenfeng, un ancien gestionnaire de hedge funds, a décrit la stratégie de l’entreprise: « Nous estimons que les meilleurs modèles nationaux et étrangers peuvent présenter un écart d’un facteur 1 dans la structure du modèle et la dynamique de formation. Pour cette raison, nous devons consommer quatre fois plus de puissance de calcul pour obtenir le même effet. Ce que nous devons faire, c’est réduire continuellement ces écarts.”[36Kr].

Effets d’entraînement sur les marchés mondiaux

La sortie de R1 a déclenché une forte vente en Les valeurs technologiques mondiales Nvidia, dont les GPU sont largement considérés comme essentiels au développement de l’IA, ont vu leur valorisation chuter de plusieurs milliards

Fabricant de puces européen ASML Holding NV a également subi une baisse de 11 %, tandis que les contrats à terme sur le Nasdaq 100 ont enregistré des volumes de transactions quatre fois supérieurs à la moyenne quotidienne. d’ici lundi matin. Les investisseurs réévaluent les fondements financiers du secteur de l’IA, qui a entraîné une croissance significative des valeurs technologiques au cours de l’année écoulée.

Les retombées s’étendent au-delà des États-Unis, avec les Chinois Actions liées à l’IA telles que Merit Interactive Co. a bondi de 20 % en réponse au succès de DeepSeek. L’L’indice technologique Hang Seng a augmenté avant le Nouvel An lunaire, reflétant optimisme quant à la présence croissante de la Chine dans l’innovation en matière d’IA.

La dimension géopolitique : sanctions et innovation

La montée en puissance de DeepSeek est une réponse directe aux contrôles américains sur les exportations destinés à limiter l’accès de la Chine aux technologies avancées. Depuis 2021, ces restrictions visent à empêcher le développement de systèmes d’IA compétitifs en Chine en restreignant l’accès au matériel de pointe.

Cependant, l’utilisation ingénieuse des GPU H800 par DeepSeek a démontré que l’innovation peut prospérer même dans des conditions strictes. contraintes.

La stratégie de Liang consistant à stocker des GPU restreints avant que les sanctions n’entrent pleinement en vigueur a été cruciale. En se concentrant sur l’efficacité plutôt que sur la puissance de calcul brute, les ingénieurs de DeepSeek ont ​​montré comment les contraintes peuvent conduire à une résolution créative de problèmes.

Yann LeCun, scientifique en chef de l’IA chez Meta, a salué la philosophie open source derrière le développement de R1, déclarant: « DeepSeek a profité de la recherche ouverte et de l’open source (par exemple, PyTorch et Llama de Meta). Ils ont trouvé de nouvelles idées et les ont construites en s’appuyant sur le travail d’autres personnes.”

Implications pour les géants américains de la technologie

Le succès du modèle R1 de DeepSeek pose des problèmes Des questions inconfortables pour les leaders technologiques américains comme Meta et Microsoft, qui ont investi des milliards dans l’infrastructure d’IA, Mark Zuckerberg, a récemment présenté les plans ambitieux de l’entreprise visant à déployer plus de 1,3 million de GPU en 2025. déclarant :”Nous prévoyons d’investir entre 60 et 65 milliards de dollars en investissements cette année tout en développant considérablement nos équipes d’IA, et nous disposons du capital nécessaire pour continuer à investir dans les années à venir.”

Un nouveau L’ère de l’innovation en matière d’IA

L’engagement de DeepSeek en faveur de la collaboration open source l’a distingué des géants de l’industrie. En publiant l’architecture et les méthodes de formation de R1, la société a permis aux développeurs du monde entier de reproduire ou d’améliorer son travail.

Cette transparence contraste avec la nature propriétaire de plateformes comme ChatGPT d’OpenAI, soulignant une évolution potentielle vers une innovation en matière d’IA plus accessible.

Les réalisations de DeepSeek rappellent que le leadership technologique ne se définit pas uniquement par ressources financières. Que cela marque la fin de la bulle boursière technologique aux États-Unis ou l’ouverture d’un nouveau chapitre dans la concurrence mondiale en matière d’IA, une chose est claire : les règles du jeu changent.

Categories: IT Info