La société chinoise d’IA Moonshot AI propose un nouveau modèle open source appelé Kimi K2 Thinking. Lancé le 6 novembre depuis sa base de Pékin, il marque une étape majeure dans la course mondiale pour construire une IA capable d’agir de manière autonome.
Le modèle est un « agent pensant ». Il peut résoudre des problèmes difficiles en utilisant des outils numériques en plusieurs centaines d’étapes. Moonshot veut battre ses concurrents sur le marché difficile de l’IA en Chine.
Après les modèles Kimi K2 et Kimi K2 Turbo à paramètres de mille milliards, cette nouvelle version se concentre sur le raisonnement de haut niveau et obtient les meilleurs scores aux tests de l’industrie.
Un « agent de réflexion » conçu pour un raisonnement et une utilisation d’outils complexes
Depuis son siège de Pékin, Moonshot AI joue un nouveau rôle agressif dans le secteur de l’IA.
La société a positionné Kimi K2 Thinking non seulement comme une mise à niveau, mais comme une nouvelle classe de modèle axé sur l’autonomie. exécution. Il est conçu comme un « agent pensant » capable de raisonner étape par étape pour résoudre des problèmes complexes.
Une capacité clé soulignée par l’entreprise est sa capacité à exécuter entre 200 et 300 appels d’outils séquentiels, lui permettant d’accomplir des tâches complexes en plusieurs étapes sans intervention humaine.
Contrairement à son prédécesseur, Kimi K2 Turbo, qui se concentrait sur la vitesse brute, cette nouvelle version donne la priorité à la profondeur cognitive. Son architecture sous-jacente reste un modèle de mélange d’experts (MoE) massif d’un billion de paramètres, activant 32 milliards de paramètres pour un jeton donné.
Selon la carte de modèle officielle, elle présente une longueur de contexte étendue de 256 Ko. Cette fenêtre massive lui permet de traiter et d’analyser des bases de code entières ou des centaines de pages de documents en un seul passage, une fonctionnalité cruciale pour les tâches d’entreprise complexes.
Une innovation technique importante est sa quantification native INT4, réalisée grâce à une méthode appelée Quantization-Aware Training (QAT). Cela permet au modèle de fonctionner avec des calculs de moindre précision, doublant ainsi sa vitesse d’inférence tout en conservant les performances de ses homologues de plus haute précision.
Pour les développeurs, cela rend le déploiement d’un modèle comportant des milliards de paramètres plus réalisable et plus rentable, réduisant ainsi un obstacle majeur à l’adoption.
Moonshot rapporte que Kimi K2 Thinking a obtenu un score de 44,9 au Humanity’s Last Exam (avec outils), un test de connaissances de niveau expert. Sur les tâches de recherche et de navigation agentiques comme BrowseComp, il a obtenu un score de 60,2, et lors du test de codage agent SWE-Bench Verified, il a atteint 71,3. (voir le tableau complet des références à la fin)
Ces résultats le placent à la frontière des modèles open source conçus pour les capacités agentiques.
Un pari stratégique dans les guerres féroces de l’IA en Chine
La sortie de Kimi K2 Thinking est une décision calculée sur le marché hyper-compétitif de l’IA en Chine, souvent surnommé la « guerre des cent modèles ».
Moonshot AI, autrefois une étoile montante, a été confrontée à une pression intense de la part de concurrents nationaux comme DeepSeek, Z.ai et Alibaba. Ce nouveau modèle est une tentative directe de reconquérir le leadership en déplaçant l’accent concurrentiel de la vitesse et du prix vers un raisonnement sophistiqué et des performances agents.
Ce pivot intervient après une période difficile pour l’entreprise. Son modèle original Kimi K2, lancé en juillet, était un jeu open source audacieux.
Cependant, le marché est rapidement devenu saturé d’alternatives à faible coût, en particulier de son rival DeepSeek, ce qui a déclenché une féroce guerre des prix. Cela a directement impacté la base d’utilisateurs de l’application de chat Kimi de Moonshot, qui a vu son classement national chuter.
Des données récentes pour octobre 2025 provenant de Statcounter confirme la forte concurrence, montrant que Moonshot ne fait pas actuellement partie des meilleurs fournisseurs de chatbots IA en Chine.
Moonshot parie que des capacités supérieures dans le domaine émergent de l’IA agentique peuvent construire une position plus défendable sur le marché que de rivaliser sur le seul coût. Cependant, cette concentration intense sur les performances du classement comporte ses propres risques.
Comme l’a précédemment noté le stratège en IA Nate Jones, « dès que nous fixons la domination du classement comme objectif, nous risquons de créer des modèles qui excellent dans des exercices triviaux et pataugent face à la réalité. » Moonshot vise à prouver que ses victoires de référence se traduisent par l’utilité réelle nécessaire pour reconquérir des parts de marché.
[contenu intégré]
La course mondiale à la suprématie agentique
Le dernier effort de Moonshot s’inscrit dans un changement mondial fondamental dans l’industrie de l’IA. Les entreprises vont au-delà des chatbots qui génèrent simplement des suggestions de texte ou de code.
Sa nouvelle frontière est l’intelligence agentique : créer des systèmes autonomes capables de comprendre un objectif de haut niveau, de formuler un plan et d’utiliser une variété d’outils numériques pour l’exécuter. Kimi K2 Thinking est explicitement conçu pour rivaliser dans ce domaine.
La valeur de cette approche agentique est déjà prouvée dans le monde de l’entreprise. Dans une démarche historique, la banque d’investissement Goldman Sachs a commencé à piloter le codeur d’IA autonome Devin pour créer une « main-d’œuvre hybride ». Sa vision est que des ingénieurs humains supervisent des flottes d’agents d’IA, transformant ainsi la nature du développement logiciel.
Le chef technique de Goldman, Marco Argenti, a expliqué la stratégie en déclarant:”Il s’agit en réalité de personnes et d’IA travaillant côte à côte. On s’attendra à ce que les ingénieurs aient la capacité de vraiment décrire les problèmes de manière cohérente et de les transformer en invites…”
Un tel changement reflète un avenir où la principale compétence humaine n’est pas une exécution fastidieuse mais un haut niveau. définition et supervision des problèmes.
En construisant un modèle qui excelle dans l’utilisation d’outils complexes en plusieurs étapes, Moonshot AI se positionne pour être un acteur clé dans ce nouveau paradigme. Avec Kimi K2 Thinking, l’entreprise fait le pari gros que dans un monde regorgeant de modèles puissants, celui qui raisonnera le plus efficacement finira par gagner l’écosystème des développeurs.
Kimi K2 Benchmarks
(Source : Moonshot AI)