A startup chinesa de IA MiniMax lançou um novo modelo de código aberto. A MiniMax, com sede em Xangai, lançou o MiniMax-M2 na segunda-feira. O objetivo é sacudir o mercado de IA tanto em preço quanto em poder. MiniMax diz que o M2 rivaliza com modelos de ponta como Claude Sonnet 4.5 da Anthropic. No entanto, ele custa apenas 8% do custo.
O modelo foi criado para agentes e codificação de IA. Seu design inteligente utiliza apenas 10 bilhões de parâmetros ativos. Isso mantém os custos baixos e as velocidades altas. O lançamento coloca o MiniMax em concorrência direta com os gigantes ocidentais e o rival local DeepSeek pelo crescente mercado de desenvolvedores.
Uma nova referência em desempenho e eficiência
Apoiado pelos gigantes chineses da tecnologia Alibaba e Tencent, o MiniMax está posicionando seu modelo M2 como um novo líder no espaço de código aberto.
MiniMax afirma que oferece desempenho de elite personalizado para a próxima geração de aplicativos de IA.
“O MiniMax-M2 redefine a eficiência para os agentes. É um modelo MoE compacto, rápido e econômico, criado para desempenho de elite em tarefas de codificação e de agente, ao mesmo tempo em que mantém uma inteligência geral poderosa”, afirma a documentação oficial do modelo.
Seu foco em tarefas de agente-onde uma IA deve planejar, agir e verificar fluxos de trabalho complexos-visa uma área de crescimento significativo na indústria de software, indo além da simples IA de conversação para sistemas que podem concluir tarefas complexas de forma independente.
Fonte: MiniMax
Testes independentes apoiam essas afirmações. Benchmarks de terceiros da Análise Artificial colocam o MiniMax-M2 entre os cinco primeiros do mundo em inteligência geral, concedendo-lhe uma pontuação de 61%.
Essa classificação o coloca à frente de concorrentes como o Gemini 2.5 Pro do Google. (60%) e no mesmo nível de Claude Sonnet 4.5 da Anthropic (63%).
Para os desenvolvedores, isso significa acesso a um modelo poderoso e aberto que pode lidar com cenários sofisticados de codificação e uso de ferramentas sem ficar preso a um ecossistema proprietário.
O ‘Triângulo Impossível’: Equilibrando poder, velocidade e custo
Para anos, os desenvolvedores enfrentaram um equilíbrio entre a inteligência de um modelo, sua velocidade de inferência e seu custo operacional-um “triângulo impossível”.
MiniMax afirma que o M2 aborda diretamente esse desafio.
“Temos explorado se é possível criar um modelo que alcance um melhor equilíbrio entre desempenho, preço e velocidade, permitindo assim que mais pessoas se beneficiem do aumento de inteligência da era do Agente”, afirmou a equipe em um comunicado. postagem no blog.
A chave para esse equilíbrio é a arquitetura do modelo, que prioriza a economia computacional sem sacrificar a capacidade.
Ao desenvolver uma arquitetura de mistura de especialistas (MoE), o M2 aproveita um enorme pool de 230 bilhões de parâmetros totais, mas ativa apenas 10 bilhões para qualquer tarefa, de acordo com suas especificações técnicas.
O M2 é significativamente mais eficiente do que modelos rivais como o DeepSeek, que ativa 37 bilhões de parâmetros por token.
Essa escolha arquitetônica reduz drasticamente a sobrecarga computacional e os requisitos de memória, traduzindo-se diretamente em custos operacionais mais baixos e tempos de resposta mais rápidos.
O impacto económico poderá ser dramático. A MiniMax definiu seu preço de API em apenas US$ 0,30 por milhão de tokens de entrada e US$ 1,20 por milhão de tokens de saída.
Esse preço agressivo é de aproximadamente 8% do custo do Claude 3.5 Sonnet, enquanto a MiniMax afirma que o M2 oferece quase o dobro da velocidade de inferência.
Essa eficiência tem implicações profundas para o desenvolvimento de agentes de IA, onde loops de processamento mais rápidos e baratos permitem mais fluxos de trabalho complexos e responsivos, tornando ferramentas sofisticadas de IA mais acessíveis e escaláveis do que nunca.
A ofensiva de código aberto da China continua
Em um movimento que consolida ainda mais a liderança da China no espaço de IA de código aberto, a MiniMax disponibilizou totalmente os pesos do modelo M2 na plataforma do desenvolvedor Hugging Face.
MiniMax dá continuidade a uma tendência estabelecida por outras empresas chinesas como a DeepSeek, que buscaram agressivamente uma estratégia de código aberto para construir uma comunidade, impulsionar a adoção global e competir em meio à feroz guerra tecnológica EUA-China.
O código aberto fornece um caminho estratégico para empresas que enfrentam restrições de hardware, permitindo-lhes competir em inovação e custo.
Essa estratégia coloca o MiniMax em concorrência direta com seu rival doméstico, uma rivalidade que vem esquentando há algum tempo.
No início deste ano, o MiniMax lançou seu modelo M1 especificamente para desafiar o domínio do DeepSeek no espaço do modelo de raciocínio, enfatizando um Apache mais permissivo. 2.0 como um diferencial importante.
O lançamento do M2 impulsiona essa competição ainda mais, visando a mesma comunidade de desenvolvedores com uma oferta atraente de desempenho superior a um custo menor.
“O lançamento do MiniMax dá continuidade à liderança dos laboratórios chineses de IA em código aberto que o DeepSeek iniciou no final de 2024 e que foi continuado por lançamentos contínuos do DeepSeek, Alibaba, Z AI e Moonshot AI”, declarou Análise Artificial.
O lançamento faz parte de um padrão mais amplo de inovação da empresa, que possui um portfólio diversificado que inclui ferramentas de geração de vídeo e já estabeleceu benchmarks com modelos que quebram recordes Janelas de contexto de 4 milhões de tokens.
O foco da MiniMax em modelos de código aberto e de alta eficiência sinaliza um impulso estratégico para capturar uma fatia significativa do mercado. Ao resolver o equilíbrio crítico entre poder, velocidade e custo, o modelo M2 não apenas desafia a ordem estabelecida, mas também fornece aos desenvolvedores em todo o mundo uma nova ferramenta poderosa para construir a próxima geração de aplicativos orientados por IA.