La startup de l’IA chinoise Moonshot AI a intensifié les ambitions de l’IA du pays avec la sortie du 1er août de Kimi-K2-Turbo-Preview. The new high-speed version of its Kimi K2 model boosts output fourfold to 40 tokens per second, a direct challenge to domestic and global rivals.
To aggressively drive adoption, the Beijing-based company is also offering a 50% price cut until September 1, 2025. This move aims to challenge competitors like Alibaba and Z.ai on both speed and cost, signaling a new phase in the battle for AI Dominance.
En associant des performances plus élevées avec une tarification agressive, Moonshot cherche à récupérer sa position de marché. Il s’agit d’une offre stratégique pour gagner les développeurs dans la course mondiale pour une IA plus autonome et agentique, où la vitesse d’inférence devient aussi importante que la puissance brute.
Kimi K2 Turbo: un besoin stratégique de vitesse
Le nouveau modèle à grande vitesse est une optimisation critique, pas un remplacement. Il maintient les mêmes paramètres puissants que le Kimi K2 d’origine, un modèle massif d’un milliard de paramètres publié pour la première fois le 11 juillet. La différence clé est une augmentation spectaculaire de la vitesse d’inférence, une métrique cruciale pour les applications de sortie réelles. Cela offre aux utilisateurs une expérience plus fluide et plus efficace. La société a déclaré que la version est juste le Le début de ses efforts d’optimisation
Le prix promotionnel est égal. Pendant la période de réduction, les prix par million de jetons sont de 8,00 ¥ pour les entrées et 32,00 ¥ pour la production. Cette concentration sur la vitesse et les coûts signale un changement stratégique au-delà de la suprématie de référence à la convivialité pratique et à l’adoption des développeurs.
Cette concentration sur la vitesse est une réponse directe à la dynamique du marché. À mesure que les modèles IA deviennent plus puissants, la réactivité est un différenciateur clé. Un modèle plus rapide améliore l’expérience utilisateur pour des applications interactives comme le propre Moonshot Kimi Chat Apple et est essentiel pour les développeurs construisant des produits viables. «La guerre de cent modèles» de la Chine. Cette décision est une tentative claire pour inverser une baisse récente de la position du marché, où le classement de la base d’utilisateurs de son application Kimi a glissé de manière significative après la libération perturbatrice de modèles à faible coût par rival Deepseek. Cette nouvelle version signale Moonshot réintégré la mêlée, en concurrence agressive sur plusieurs fronts.
La guerre des prix s’échelle rapidement. Fin juillet, la startup Z.AI (anciennement Zhipu) a lancé ses puissants modèles GLM-4.5, sous-évaluant explicitement Deepseek sur le coût. Cette tarification des tit-for-tat oblige les entreprises à innover sur l’efficacité, pas seulement la puissance brute. La bataille pour la performance est tout aussi intense, le géant de la technologie Alibaba a récemment publié son modèle de coder QWEN3 pour capturer l’espace de codage agentique.
Cependant, ce concours est ouverte par une crise de confiance dans l’évaluation de l’IA. Le lancement d’Alibaba a été assombri par des allégations selon lesquelles son précédent modèle QWEN2.5 avait «triché» sur des références clés en mémorisant les données de test. Cette controverse met en évidence un risque systémique, comme l’a noté le stratège de l’IA, Nate Jones: «Au moment où nous fixons la domination des classements comme objectif, nous risquons de créer des modèles qui excellent dans des exercices triviaux et de la plie lorsqu’ils sont confrontés à la réalité. Le gouvernement américain a exprimé une profonde inquiétude face au développement chinois de l’IA, le président du comité de la Chambre, John Moolenaar, décrivant une entreprise rivale comme «une arme dans l’arsenal du Parti communiste chinois», mettant en évidence les enjeux élevés. Cette pression oblige les entreprises chinoises à innover dans des contraintes significatives, telles que le fonctionnement de Z.AI tandis que sur une liste d’entités américaines.
Ces contraintes ont un impact direct sur le matériel disponible, forçant la dépendance à l’égard des puces contrôlées par l’exportation. Z.AI a transformé cela en un avantage stratégique, concevant ses modèles d’efficacité sur ce matériel. Cette décision est particulièrement nette, car le modèle R2 de nouvelle génération de Deepseek serait bloqué en raison des pénuries de matériel que Z.AI a naviguées.
La stratégie de Moonshot de l’ouverture de ses modèles puissants et maintenant en concurrence sur la vitesse et le prix semble calculé pour construire une base de développeurs fidèles à la fois à la maison et à l’étranger. Il s’agit d’une approche à plusieurs volets conçue pour contrer les pressions externes et récupérer la part de marché intérieure en démontrant la supériorité dans les mesures qui comptent le plus aux utilisateurs: vitesse, coût et performances pratiques.
La race plus large pour la suprématie agentique
Cette rivalité domestique fait partie d’un changement global fondamental vers l’intelligence professionnelle. L’industrie va au-delà des chatbots simples pour créer des agents autonomes qui peuvent comprendre un objectif, élaborer un plan et utiliser des outils pour effectuer des tâches complexes et en plusieurs étapes.