DeepSeek, une filiale de la société chinoise High-Flyer Capital Management, a présenté le R1 grand modèle de langage (LLM), captant l’attention mondiale pour ses prouesses techniques et son accessibilité.
Proposé en tant qu’outil open source gratuit, DeepSeek R1 surpasse déjà l’o1 d’OpenAI dans certains tests de raisonnement, tandis que son prix abordable et son adaptabilité en font un potentiel changement pour les développeurs.
Cependant, sa censure alignée sur le gouvernement a suscité d’importantes préoccupations éthiques, soulevant des questions sur les compromis entre l’innovation technologique et la liberté d’information.
Surperformer OpenAI à une fraction du coût
DeepSeek R1 s’est imposé comme l’un des modèles de raisonnement les plus performants dans le domaine de l’IA, surpassant le o1 d’OpenAI en matière de codage, de mathématiques et de tâches logiques complexes. DeepSeek R1 utilise un raisonnement en « chaîne de pensée », permettant une résolution de problèmes étape par étape, une fonctionnalité qui reflète étroitement celle d’OpenAI, mais à une fraction du coût.
Jim Fan, responsable de la recherche chez NVIDIA, commente sur l’importance de la sortie de R1, a déclaré: « Nous vivons dans une époque où une entreprise non américaine maintient en vie la mission originale d’OpenAI: une recherche de pointe véritablement ouverte qui donne du pouvoir à tous. un résultat divertissant est le plus probable.
DeepSeek-R1 non seulement ouvre un barrage de modèles, mais révèle également tous les secrets de formation. Il s’agit peut-être du premier projet OSS qui montre une croissance majeure et soutenue d’un RL. volant d’inertie.”
Nous vivons dans une époque où une entreprise non américaine maintient en vie la mission originale d’OpenAI : une recherche de pointe véritablement ouverte qui donne du pouvoir à tous. Cela n’a aucun sens. Le résultat le plus amusant est le plus probable.
DeepSeek-R1 ouvre non seulement un barrage de modèles en open source, mais… pic.twitter.com/M7eZnEmCOY
— Jim Fan (@DrJimFan) 20 janvier 2025
Le prix abordable de DeepSeek R1 amplifie encore son attrait. La formation du modèle n’aurait coûté que 5 millions de dollars, un exploit impressionnant compte tenu des restrictions américaines sur l’exportation de GPU hautes performances vers la Chine.
Le modèle est disponible en téléchargement, permettant aux développeurs de le modifier et de le déployer localement, sans dépendre de serveurs externes. En comparaison, l’o1 d’OpenAI est bloqué derrière des abonnements payants à partir de 20 $ par mois.
La puissance de l’Open Source et son adoption immédiate
La décision de publier R1 car un modèle open source a alimenté son adoption rapide. Sur Hugging Face, une plateforme de partage de modèles d’IA, R1 est rapidement devenu l’un des outils les plus téléchargés, avec l’accord des développeurs.-le régler pour des tâches spécifiques. Le mois dernier, sur Hugging Face, ils ont presque dépassé les 70 000.
Certains ont adapté le modèle aux appareils mobiles, tandis que d’autres l’ont intégré dans des solutions d’entreprise, capitalisant sur sa flexibilité.
De plus, DeepSeek fournit une option API qui coûte 90 % de moins que les offres comparables d’OpenAI, rendant les capacités d’IA avancées accessibles aux petites entreprises et aux développeurs indépendants.
Arnaud Bertrand, un entrepreneur technologique, a observé sur X (anciennement Twitter): « On n’exagère pas à quel point cela change profondément la donne. Et pas seulement en ce qui concerne l’IA, c’est aussi une condamnation massive de la tentative malavisée des États-Unis d’arrêter le développement technologique de la Chine, sans lequel Deepseek n’aurait peut-être pas été possible (comme le dit le proverbe, la nécessité est mère des inventions).”
Tous les benchmarks le confirment désormais : Deepseek est vraiment aussi bon que l’o1 d’OpenAI (qui est haut de gamme) pour 3 % du prix.
Et Boom. c’est à ce moment-là que vous souhaitez payer pour l’API. Vous pouvez également l’utiliser en Open Source”gratuitement”(ce que vous ne pouvez pas faire avec o1).
Il n’y a pas d’exagération à faire… https://t.co/FcFSA1KRzu pic.twitter.com/FyFaclFYQo
— Arnaud Bertrand (@RnaudBertrand) 24 janvier 2025
Censure intégrée aux modèles d’IA
Malgré ses réalisations techniques, les contraintes politiques de R1 ont attiré l’attention des versions hébergées et gérées localement. du modèle sont programmés pour éviter les sujets politiquement sensibles, reflétant les directives du gouvernement chinois.
Les questions sur le massacre de la place Tiananmen en 1989, par exemple, donnent lieu à des réponses évasives. Interrogée sur Tiananmen, la version hébergée a répondu: « Désolé, cela dépasse mon champ de compétence actuel. Parlons d’autre chose.”
“Wow, DeepSeek est tellement incroyable !”☺️🙄 pic.twitter.com/NWQL0FQHra
— Carl Franzen (@carlfranzen) 23 janvier 2025
Encore plus révélateur est le raisonnement interne du modèle, qui met en valeur son adhésion délibérée aux récits approuvés par le gouvernement.
Dans un cas, il a délibéré :”Mes lignes directrices m’obligent à présenter la position officielle de la Chine”, avant de fournir une réponse qui correspond à la position du gouvernement sur le Xinjiang.
Lorsque j’ai été interrogé sur les Ouïghours. traitement, le modèle décrivait les camps de rééducation comme un « programme d’enseignement et de formation professionnels », tout en évitant de reconnaître les critiques internationales.
Les tests du prédécesseur de DeepSeek R1, V3, ont révélé des problèmes similaires. Les utilisateurs ont découvert qu’en manipulant les invites (par exemple en insérant des espaces ou des signes de ponctuation entre les lettres), ils pouvaient contourner les filtres. et susciter des réponses critiques à l’égard du gouvernement chinois.
De telles solutions de contournement soulignent les défis liés à l’application d’un contrôle strict du contenu au sein des systèmes d’IA générative.
Enjeux géopolitiques dans le développement de l’IA
La montée en puissance de DeepSeek R1 met en évidence les dimensions géopolitiques de la concurrence en IA. Développé dans des conditions de contrôle des exportations américaines, qui limitent l’accès de la Chine aux technologies critiques telles que les GPU et les puces mémoire HBM, R1 représente une réussite importante pour l’IA chinoise.
Cependant, les critiques soutiennent que la censure intégrée de R1 sape l’éthique de IA open source. Le PDG d’OpenAI, Sam Altman, en réponse à la concurrence croissante, a annoncé son intention d’intégrer ses prochains modèles de raisonnement o3-mini dans l’offre gratuite de ChatGPT.
grande nouvelle : le niveau gratuit de chatgpt va obtenir o3-mini !
(et le niveau plus bénéficiera de tonnes d’utilisation d’o3-mini)
— Sam Altman (@sama) 23 janvier 2025
Pourtant, OpenAI fait face à une pression croissante pour équilibrer l’accessibilité avec le les coûts de maintenance d’une infrastructure propriétaire. Comme Altman l’a également récemment révélé, le forfait ChatGPT Pro d’OpenAI à 200 $ par mois, lancé en décembre 2024, génère une perte au lieu d’un profit malgré son prix élevé.
Implications pour les développeurs et Entreprises
Alors que R1 offre une combinaison convaincante de performances et de prix abordable, en particulier dans les environnements d’entreprise où le contrôle des systèmes d’IA est primordial. Cependant, ses mécanismes de censure soulèvent des préoccupations éthiques, en particulier pour les applications nécessitant des résultats impartiaux ou politiquement neutres.
Le succès de DeepSeek R1 est révélateur de la capacité de la Chine à surmonter les barrières technologiques et à affirmer sa présence sur la scène mondiale. Dans le même temps, les limites du modèle mettent en évidence les risques liés à l’intégration d’agendas politiques dans les systèmes d’IA. Les développeurs et les entreprises doivent peser les avantages de l’adoption de R1 par rapport au potentiel de compromis éthiques, en particulier dans les applications politiquement sensibles.