L’azienda cinese di intelligenza artificiale Moonshot AI ha un nuovo modello open source chiamato Kimi K2 Thinking. Lanciato il 6 novembre dalla sua base a Pechino, segna un passo importante nella corsa globale per costruire un’intelligenza artificiale in grado di agire da sola.
Il modello è un”agente pensante”. Può risolvere problemi difficili utilizzando strumenti digitali in centinaia di passaggi. Moonshot vuole battere i suoi rivali nel difficile mercato cinese dell’intelligenza artificiale.
Dopo i modelli Kimi K2 e Kimi K2 Turbo da trilioni di parametri, questa nuova versione si concentra su un ragionamento di alto livello e ottiene i migliori punteggi nei test di settore.
Un”agente pensante”creato per il ragionamento complesso e l’uso di strumenti
Dalla sua sede di Pechino, Moonshot AI sta facendo un altro passo aggressivo nel settore dell’intelligenza artificiale.
L’azienda ha posizionato Kimi K2 Thinking non semplicemente come un aggiornamento, ma come una nuova classe di modello focalizzata sull’esecuzione autonoma. È progettato come un”agente pensante”in grado di ragionare passo dopo passo per risolvere problemi complessi.
Una capacità chiave evidenziata dall’azienda è la sua capacità di eseguire tra 200 e 300 chiamate sequenziali di strumenti, consentendogli di completare attività complesse in più fasi senza intervento umano.
A differenza del suo predecessore, Kimi K2 Turbo, che si concentrava sulla velocità pura, questa nuova versione dà priorità alla profondità cognitiva. La sua architettura sottostante rimane un enorme modello Mixture-of-Experts (MoE) da un trilione di parametri, che attiva 32 miliardi di parametri per ogni token dato.
Secondo la scheda del modello ufficiale, presenta una lunghezza del contesto estesa di 256K. Questa enorme finestra consente di elaborare e analizzare intere basi di codice o centinaia di pagine di documenti in un unico passaggio, una caratteristica cruciale per attività aziendali complesse.
Un’innovazione tecnica significativa è la quantizzazione INT4 nativa, ottenuta attraverso un metodo chiamato Quantization-Aware Training (QAT). Ciò consente al modello di funzionare con calcoli di precisione inferiore, raddoppiando di fatto la sua velocità di inferenza mantenendo le prestazioni delle sue controparti con precisione più elevata.
Per gli sviluppatori, questo rende l’implementazione di un modello da trilioni di parametri più fattibile dal punto di vista computazionale ed economico, riducendo un importante ostacolo all’adozione.
Moonshot riferisce che Kimi K2 Thinking ha ottenuto un punteggio di 44,9 al Humanity’s Last Exam (con strumenti), un test di conoscenza a livello di esperto. Nelle attività di ricerca e navigazione con agenti come SfogliaComp, ha ottenuto un punteggio di 60,2 e nel test di codifica con agenti SWE-Bench Verified, ha raggiunto 71,3. (vedi la tabella completa dei benchmark alla fine)
Questi risultati lo collocano alla frontiera dei modelli open source progettati per le capacità degli agenti.
Una mossa strategica nelle feroci guerre dell’IA in Cina
Il rilascio di Kimi K2 Thinking è una mossa calcolata nel mercato ipercompetitivo dell’IA cinese, spesso soprannominato la”guerra dei cento modelli”.
Moonshot AI, un tempo una stella nascente, ha dovuto affrontare forti pressioni da parte di rivali nazionali come DeepSeek, Z.ai e Alibaba. Questo nuovo modello è un tentativo diretto di riconquistare la leadership spostando l’attenzione competitiva dalla velocità e dal prezzo al ragionamento sofisticato e alle prestazioni degli agenti.
Questo cambiamento arriva dopo un periodo difficile per l’azienda. Il suo modello originale Kimi K2, lanciato a luglio, è stato un audace gioco open source.
Tuttavia, il mercato si è rapidamente saturato di alternative a basso costo, in particolare del rivale DeepSeek, che ha innescato una feroce guerra dei prezzi. Ciò ha avuto un impatto diretto sulla base utenti dell’applicazione di chat Kimi di Moonshot, che ha visto la sua caduta nella classifica nazionale.
Dati aggiornati per ottobre 2025 da Statcounter conferma la forte concorrenza, mostrando che Moonshot non è attualmente tra i principali fornitori di chatbot AI in Cina.
Moonshot scommette che capacità superiori nel campo emergente dell’intelligenza artificiale possono costruire una posizione di mercato più difendibile rispetto alla concorrenza basata solo sui costi. Tuttavia, questa intensa attenzione alle prestazioni della classifica comporta i suoi rischi.
Come ha notato in precedenza lo stratega dell’intelligenza artificiale Nate Jones,”nel momento in cui stabiliamo come obiettivo il dominio della classifica, rischiamo di creare modelli che eccellono in esercizi banali e falliscono quando affrontano la realtà.”Moonshot mira a dimostrare che i suoi successi nei benchmark si traducono nell’utilità nel mondo reale necessaria per riconquistare quote di mercato.
[contenuto incorporato]
La corsa globale per la supremazia agentica
L’ultimo sforzo di Moonshot fa parte di un cambiamento globale fondamentale nel settore dell’intelligenza artificiale. Le aziende stanno andando oltre i chatbot che generano semplicemente suggerimenti di testo o codice.
La sua nuova frontiera è l’intelligenza degli agenti: creare sistemi autonomi in grado di comprendere un obiettivo di alto livello, formulare un piano e utilizzare una varietà di strumenti digitali per eseguirlo. Kimi K2 Thinking è esplicitamente progettato per competere in quest’arena.
Il valore di questo approccio agente è già stato dimostrato nel mondo aziendale. Con una mossa storica, la banca d’investimento Goldman Sachs ha iniziato a pilotare il programmatore di intelligenza artificiale autonomo Devin per creare una “forza lavoro ibrida”. La sua visione è che gli ingegneri umani supervisionino flotte di agenti IA, trasformando la natura dello sviluppo software.
Il capo tecnico di Goldman, Marco Argenti, ha spiegato la strategia, affermando:”Si tratta davvero di persone e IA che lavorano fianco a fianco. Ci si aspetta che gli ingegneri abbiano la capacità di descrivere realmente i problemi in modo coerente e trasformarli in suggerimenti…”
Tale cambiamento riflette un futuro in cui la principale abilità umana non è la noiosa esecuzione ma definizione e supervisione dei problemi di alto livello.
Costruendo un modello che eccelle nell’uso di strumenti complessi e in più fasi, Moonshot AI si sta posizionando per essere un attore chiave in questo nuovo paradigma. Con Kimi K2 Thinking, l’azienda sta scommettendo ad alta posta che, in un mondo pieno di modelli potenti, quello in grado di ragionare in modo più efficace alla fine vincerà l’ecosistema degli sviluppatori.
Kimi K2 Benchmarks
(Fonte: Moonshot AI)