A empresa chinesa de IA Moonshot AI tem um novo modelo de código aberto chamado Kimi K2 Thinking. Lançado em 6 de novembro a partir de sua base em Pequim, ele marca um passo importante na corrida global para construir uma IA que possa agir por conta própria.
O modelo é um “agente pensante”. Ele pode resolver problemas difíceis usando ferramentas digitais em centenas de etapas. A Moonshot quer vencer seus rivais no difícil mercado de IA da China.
Seguindo os modelos Kimi K2 de trilhões de parâmetros e Kimi K2 Turbo, esta nova versão se concentra no raciocínio de alto nível e tem as melhores pontuações em testes da indústria.
Um ‘agente pensante’ criado para raciocínio complexo e uso de ferramentas
Em sua sede em Pequim, a Moonshot AI está fazendo outra jogada agressiva no setor de IA.
A empresa posicionou o Kimi K2 Thinking não apenas como uma atualização, mas como uma nova classe de modelo focada em autonomia execução. Ele foi projetado como um “agente pensante” capaz de raciocinar passo a passo para resolver problemas complexos.
Um recurso importante destacado pela empresa é sua capacidade de executar entre 200 e 300 chamadas de ferramentas sequenciais, permitindo concluir tarefas complexas e de vários estágios sem intervenção humana.
Ao contrário de seu antecessor, Kimi K2 Turbo, que se concentrava na velocidade bruta, esta nova versão prioriza a profundidade cognitiva. Sua arquitetura subjacente continua sendo um enorme modelo Mixture-of-Experts (MoE) de um trilhão de parâmetros, ativando 32 bilhões de parâmetros para qualquer token.
De acordo com o cartão de modelo oficial, ele apresenta um comprimento de contexto expandido de 256K. Essa enorme janela permite processar e analisar bases de código inteiras ou centenas de páginas de documentos em uma única passagem, um recurso crucial para tarefas empresariais complexas.
Uma inovação técnica significativa é a quantização nativa do INT4, obtida por meio de um método chamado Quantization-Aware Training (QAT). Isso permite que o modelo seja executado com cálculos de menor precisão, dobrando efetivamente sua velocidade de inferência e mantendo o desempenho de seus equivalentes de maior precisão.
Para os desenvolvedores, isso torna a implantação de um modelo de trilhão de parâmetros mais viável computacionalmente e econômica, reduzindo uma grande barreira à adoção.
Moonshot relata que Kimi K2 Thinking obteve nota 44,9 no Último Exame da Humanidade (com ferramentas), um teste de conhecimento de nível especializado. Em tarefas de pesquisa e navegação de agente, como BrowseComp, obteve pontuação de 60,2, e no teste de codificação de agente SWE-Bench Verified, atingiu 71,3. (veja a tabela completa de benchmarks no final)
Esses resultados o colocam na fronteira dos modelos de código aberto projetados para capacidades de agente.
Um Gambito Estratégico nas ferozes guerras de IA da China
Lançar o Kimi K2 Thinking é um movimento calculado no hipercompetitivo mercado de IA da China, muitas vezes apelidado de “guerra de cem modelos”.
Moonshot AI, que já foi uma estrela em ascensão, tem enfrentado intensa pressão de rivais nacionais como DeepSeek, Z.ai e Alibaba. Este novo modelo é uma tentativa direta de recuperar a liderança, mudando o foco competitivo da velocidade e do preço para um raciocínio sofisticado e desempenho de agência.
Esse pivô ocorre após um período desafiador para a empresa. Seu modelo original Kimi K2, lançado em julho, era uma aposta ousada de código aberto.
No entanto, o mercado rapidamente ficou saturado de alternativas de baixo custo, especialmente da rival DeepSeek, o que desencadeou uma feroz guerra de preços. Isso impactou diretamente a base de usuários do aplicativo de bate-papo Kimi da Moonshot, que viu sua classificação doméstica cair.
Novos dados de outubro de 2025 de Statcounter confirmam a forte concorrência, mostrando que a Moonshot não está atualmente entre os fornecedores de chatbot de IA mais bem classificados na China.
A Moonshot aposta que a capacidade superior no campo emergente da IA de agência pode construir uma posição de mercado mais defensável do que competir apenas com base no custo. No entanto, esse foco intenso no desempenho da tabela de classificação traz seus próprios riscos.
Como observou anteriormente o estrategista de IA Nate Jones, “no momento em que definimos o domínio da tabela de classificação como meta, corremos o risco de criar modelos que se destacam em exercícios triviais e fracassam ao enfrentar a realidade”. A Moonshot pretende provar que suas vitórias em benchmarks se traduzem na utilidade do mundo real necessária para reconquistar participação de mercado.
[conteúdo incorporado]
A corrida global pela supremacia dos agentes
O esforço mais recente da Moonshot faz parte de uma mudança global fundamental na indústria de IA. As empresas estão indo além dos chatbots que simplesmente geram sugestões de texto ou código.
Sua nova fronteira é a inteligência de agente: criar sistemas autônomos que possam compreender uma meta de alto nível, formular um plano e usar uma variedade de ferramentas digitais para executá-lo. O Kimi K2 Thinking foi explicitamente projetado para competir nesta arena.
O valor dessa abordagem agencial já está sendo comprovado no mundo corporativo. Num movimento histórico, o banco de investimento Goldman Sachs começou a testar o codificador autónomo de IA Devin para criar uma “força de trabalho híbrida”. Sua visão é que engenheiros humanos supervisionem frotas de agentes de IA, transformando a natureza do desenvolvimento de software.
O chefe de tecnologia do Goldman, Marco Argenti, explicou a estratégia, afirmando:”trata-se realmente de pessoas e IAs trabalhando lado a lado. Espera-se que os engenheiros tenham a capacidade de realmente descrever problemas de maneira coerente e transformá-los em prompts…”
Tal mudança reflete um futuro onde a principal habilidade humana não é a execução tediosa, mas sim a execução tediosa. definição e supervisão de problemas de alto nível.
Ao construir um modelo que se destaca no uso de ferramentas complexas e em várias etapas, a Moonshot AI está se posicionando para ser um participante importante neste novo paradigma. Com o Kimi K2 Thinking, a empresa está apostando alto que, em um mundo repleto de modelos poderosos, aquele que consegue raciocinar de forma mais eficaz acabará por vencer o ecossistema de desenvolvedores.
Kimi K2 Benchmarks
(Fonte: Moonshot AI)