Deepseek, la société d’IA chinoise qui a attiré l’attention pour avoir offert une alternative à faible coût à OpenAI, a annoncé une suspension temporaire des garnitures de service API en raison d’une forte demande.

La décision vient comme une question L’entreprise lutte contre les problèmes de capacité du serveur, laissant les développeurs incertains de l’accès à ses modèles largement utilisés. La restriction, qui empêche les nouveaux achats de crédit pour l’utilisation de l’API, a ajouté aux préoccupations existantes concernant les vitesses d’inférence lente, les risques de sécurité et l’examen réglementaire entourant l’expansion de Deepseek sur les marchés occidentaux.

Deepseek file Pour éviter d’autres perturbations

Sur son site officiel, Deepseek a confirmé qu’il avait interrompu les recharges d’API pour empêcher l’instabilité de service plus large, bien que les crédits existants restent utilisables.

The company stated, “Due to current server resource constraints, we have temporarily suspended API service recharges to prevent any Impact potentiel sur vos opérations. Les soldes existants peuvent toujours être utilisés pour les appels. Nous apprécions votre compréhension!”

Bien qu’aucun calendrier officiel de résolution n’a été fourni, la suspension signale que Deepseek a du mal à suivre la demande écrasante qui a suivi l’adoption rapide de son modèle.

Les modèles d’IA de Deepseek ont ​​été largement adoptés en raison de leur abordabilité, de nombreuses startups passant des modèles GPT d’OpenAI à Deepseek pour les économies de coûts.

U.S. DeepSeek’s AI. While the company’s models have been seen as a cost-effective alternative to Anthropic and OpenAI, performance issues have plagued adoption.

Neal Shah, CEO of Counterforce Health, had already encountered major roadblocks before the suspension. Son entreprise, qui utilise l’IA pour aider les patients à contester les réclamations d’assurance refusées, a tenté de gérer les modèles de Deepseek par le biais de plusieurs fournisseurs de cloud.

“Nous sommes sur notre septième fournisseur”, a déclaré Shah à Business Insider .”Les autres étaient trop lents ou peu fiables.”

Les données du service de suivi des performances Analyse artificielle confirment que Les modèles de Deepseek ont ​​fonctionné à des vitesses significativement réduites sur des fournisseurs de cloud tiers aux États-Unis, opérant à seulement un tiers de la vitesse prévue dans la plupart des cas.

La propre API de Deepseek est confrontée à une instabilité persistante

Les développeurs qui s’appuyaient auparavant sur l’API native de Deepseek en tant que solution de contournement pour les services lents cloud étaient déjà confrontés à des problèmes avant même la suspension des recharges. Le 26 janvier, l’API de Deepseek a été hors ligne à la suite de ce que l’entreprise a décrit comme une «attaque malveillante».

Pour les startups comme Ping, une plate-forme de développement d’IA, la perturbation a provoqué des revers majeurs. founder Theo Browne avait testé les modèles de Deepseek depuis des mois Avant l’adoption généralisée conduit à l’instabilité de l’API.

“La plupart des entreprises offrent une très mauvaise expérience en ce moment”, a déclaré Browne à Business Insider .”Il faut 100 fois de plus pour générer une réponse que tout fournisseur de modèles traditionnel.”

Bien que Deepseek ait depuis un accès partiellement restauré à son API, les développeurs continuent de signaler les incohérences, avec des vitesses d’inférence lentes faisant des applications en temps réel Presque inutilisable. >

Avant même le gel de l’API, les risques de sécurité et le contrôle réglementaire avaient fait des sociétés hésitantes à adopter les modèles de Deepseek. La marine américaine a apporté des restrictions similaires.

Pukar Hamal, PDG de Security Pal, a exprimé des doutes quant à la viabilité de Deepseek pour les clients d’entreprise.

“Je gère une entreprise de sécurité, donc je dois être super paranoïaque,”a déclaré Hamal à Business Insider. «Au moment où une startup veut vendre à une entreprise, une entreprise veut savoir à quoi ressemble votre système d’architecture de données exact. S’ils voient que vous comptez fortement sur un LLM de fabrication chinoise, ce n’est pas le cas de le vendre.”

Une étude conjointe de Cisco et de l’Université de Pennsylvanie a trouvé que Le chatbot de Deepseek a échoué à 100% des tests de sécurité conçus pour empêcher l’IA jailbreaks. , Garante, a lancé une enquête pour savoir si Deepseek est conforme aux lois sur la confidentialité des données du RGPD, en particulier en ce qui concerne les transferts de données transfrontalières.

Microsoft et Openai bénéficient des difficultés de Deepseek

Alors que Deepseek est aux prises avec l’instabilité des serveurs et les restrictions d’API, les géants de l’industrie Openai et Microsoft capitalisent sur la situation en renforçant leurs propres offres d’IA tout en examinant les pratiques de Deepseek.

. , un modèle de raisonnement d’IA moins cher et plus efficace conçu pour empêcher les développeurs de passer à Deepseek en raison de problèmes de prix. Cette décision est largement considérée comme un effort préventif pour saper l’attrait du marché de Deepseek.

Pendant ce temps, SoftBank s’est éloigné de Deepseek, annonçant qu’elle a interrompu son utilisation des modèles de l’entreprise tout en déplaçant les ressources vers son milliard de dollars annuels de 3 milliards de dollars annuels annuels annuels Investissement dans OpenAI. La décision reflète une hésitation plus large parmi les grandes entreprises à adopter des modèles d’IA chinois en raison des préoccupations réglementaires d’incertitude et de sécurité.

Les enquêtes réglementaires ciblent les infrastructures d’IA de Deepseek

au-delà La suspension de l’API, Deepseek est également confrontée à un examen réglementaire accru. Les responsables américains examinent si Deepseek a contourné les restrictions d’exportation pour acquérir des puces d’IA à haute performance par le biais de tiers à Singapour.

En vertu des réglementations américaines actuelles, les entreprises chinoises ne peuvent pas acheter légalement les GPU H100 de Nvidia, qui sont essentiels pour la formation et opérant de grands modèles d’IA. Cependant, les rapports suggèrent que Deepseek peut avoir obtenu ces puces par le biais de chaînes d’approvisionnement indirectes, ce qui soulève des questions sur les lacunes dans les politiques américaines de contrôle des exportations.

Certains experts soutiennent que le blocage des entreprises chinoises de l’infrastructure d’IA occidentale pourrait conduire à un monde fragmenté mondial Le marché de l’IA, où des entreprises comme Deepseek développent des écosystèmes d’IA entièrement indépendants, ce qui rend la surveillance réglementaire encore plus difficile.

Les fournisseurs de cloud et les développeurs s’adaptent aux limites de Deepseek

malgré Les difficultés techniques en cours de Deepseek, les fournisseurs de cloud et les startups AI sont toujours à la recherche de moyens d’intégrer ses modèles, bien que la prudence croissante.

L’entreprise matérielle AI Groq, qui se positionne comme un concurrent de Nvidia, a choisi de Utilisez le modèle de raisonnement de Deepseek pour améliorer Native nativement de Meta’s Llama AI au lieu de diriger les modèles de Deepseek.

(GROQ est spécialisé dans les unités de traitement du langage (LPU), qui diffèrent des unités de traitement graphique de Nvidia (GPU). En août 2024, GROQ a collecté un impressionnant 640 millions de dollars dans une série de financement de la série D dirigée par BlackRock Private Equity Partners.)

Entre-temps, Baseten, un fournisseur d’infrastructure de cloud AI, a testé différentes méthodes de déploiement pour optimiser la vitesse d’inférence de Deepseek . Le PDG Tuhin Srivastava a révélé qu’avant le déploiement de l’API du 26 janvier de Deepseek, le déploiement de Baseten était en fait plus rapide que la propre API native de Deepseek.

Chez Hyperbolic Labs, une entreprise d’infrastructure de cloud AI, CEO Jasper Zhang a déclaré à Business Insider que les utilisateurs d’inférence ont augmenté de 150% après avoir ajouté des modèles Deepseek, tandis que les inscriptions totales de nouveaux utilisateurs ont bondi de 400% en janvier seulement. Les chiffres suggèrent que malgré les limitations techniques, la demande de modèles d’IA abordables reste élevée.

Les développeurs recherchent des alternatives car l’avenir de Deepseek reste incertain

alors que certaines entreprises sont Essayant de contourner les limites de Deepseek, d’autres envisagent de s’en éloigner entièrement. La suspension temporaire des recharges du service API a conduit à des questions sur la fiabilité à long terme de Deepseek, certains développeurs craignant que ces problèmes ne deviennent des problèmes récurrents.

Pour les applications qui ne nécessitent pas de performances à faible latence , les développeurs sont toujours prêts à travailler avec les modèles de Deepseek. Par exemple, Neal Shah de Couterforce Health a déclaré que de légers retards dans le traitement des appels de réclamation d’assurance sont gérables. Cependant, pour les applications d’IA qui nécessitent des réponses en temps réel, telles que le service client automatisé ou l’interaction vocale, les vitesses d’inférence lente de Deepseek restent un barrage routier majeur.

Shah développe également un outil alimenté par AI qui appellera l’assurance Les entreprises au nom des patients, un cas d’utilisation qui demande à l’IA de fonctionner à une vitesse de conversation humaine. Si les vitesses de l’API de Deepseek et la stabilité ne s’améliorent pas, Shah dit que son entreprise devra passer à un autre fournisseur.

La suspension temporaire de Deepseek des recharges du service API est plus qu’un simple problème technique-il reflète plus profondément Défis d’infrastructure dans l’industrie de l’IA. À mesure que la demande de modèles de langue importante augmente, les fournisseurs d’IA doivent être en mesure de faire évoluer leur infrastructure sans sacrifier les performances.

De plus, car l’intervention gouvernementale dans l’infrastructure d’IA s’intensifie, des entreprises comme Deepseek doivent naviguer dans un environnement réglementaire complexe. Alors que certains décideurs politiques soutiennent que la restriction des modèles d’IA chinois est une priorité de la sécurité nationale, d’autres craignent que le blocage de l’accès d’IA ne puisse entraîner une isolation technologique, ce qui rend la collaboration mondiale plus difficile.

Pour l’instant, Deepseek reste un grand coût à faible coût à faible coût à faible coût. mais une option instable pour les startups. S’il peut résoudre les problèmes d’évolutivité, les risques de sécurité et les préoccupations réglementaires, il pourrait devenir un concurrent sérieux pour Openai et anthropique. Cependant, si l’instabilité de l’API et les restrictions commerciales américaines persistent, sa présence sur les marchés occidentaux peut être gravement limitée.

Categories: IT Info