A startup chinesa de IA MiniMax lançou um novo modelo de código aberto. A MiniMax, com sede em Xangai, lançou o MiniMax-M2 na segunda-feira. O objetivo é sacudir o mercado de IA tanto em preço quanto em poder. MiniMax diz que o M2 rivaliza com modelos de ponta como Claude Sonnet 4.5 da Anthropic. No entanto, ele custa apenas 8% do custo.

O modelo foi criado para agentes e codificação de IA. Seu design inteligente utiliza apenas 10 bilhões de parâmetros ativos. Isso mantém os custos baixos e as velocidades altas. O lançamento coloca o MiniMax em concorrência direta com os gigantes ocidentais e o rival local DeepSeek pelo crescente mercado de desenvolvedores.

Uma nova referência em desempenho e eficiência

Apoiado pelos gigantes chineses da tecnologia Alibaba e Tencent, o MiniMax está posicionando seu modelo M2 como um novo líder no espaço de código aberto.

MiniMax afirma que oferece desempenho de elite personalizado para a próxima geração de aplicativos de IA.

“O MiniMax-M2 redefine a eficiência para os agentes. É um modelo MoE compacto, rápido e econômico, criado para desempenho de elite em tarefas de codificação e de agente, ao mesmo tempo em que mantém uma inteligência geral poderosa”, afirma a documentação oficial do modelo.

Seu foco em tarefas de agente-onde uma IA deve planejar, agir e verificar fluxos de trabalho complexos-visa uma área de crescimento significativo na indústria de software, indo além da simples IA de conversação para sistemas que podem concluir tarefas complexas de forma independente.

BenchmarkMiniMax-M2Claude Sonnet 4Claude Sonnet 4.5Gemini 2.5 ProGPT-5 (pensando)GLM-4.6Kimi K2 0905DeepSeek-V3.2SWE-bench verificado 69,4 72,7 * 77,2 * 63,8 * 74,9 * 68 * 69,2*67,8* Multi-SWE-Bench 36,2 35,7 * 44,3//30 33,5 30,6 SWE-bench Multilingual 56,5 56,9 * 68//53,8 55,9 * 57,9 * Terminal-Bench 46,3 36,4 * 50*25,3*43,8*40,5*44,5*37,7* ArtifactsBench 66,8 57,3* 61,5 57,7* 73* 59,8 54,2 55,8 BrowseComp 44 12,2 19,6 9,9 54,9* 45,1* 14,1 40,1* BrowseComp-zh 48,5 29,1 40,8 32,2 65 49,5 28,8 47,9* GAIA (somente texto) 75,7 68,3 71,2 60,2 76,4 71,9 60,2 63,5 xbench-DeepSearch 72 64,6 66 56 77,8 70 61 71 HLE (com ferramentas) 31,8 20,3 24,5 28,4*35,2*30,4*26,9 * 27,2 * τ²-Bench 77,2 65,5* 84,7* 59,2 80,1* 75,9* 70,3 66,7 FinSearchComp-global 65,5 42 60,8 42,6* 63,9* 29,2 29,5* 26,2 EmpresaAgente 36 37 41 39,3*/35 30 34

Fonte: MiniMax

Testes independentes apoiam essas afirmações. Benchmarks de terceiros da Análise Artificial colocam o MiniMax-M2 entre os cinco primeiros do mundo em inteligência geral, concedendo-lhe uma pontuação de 61%.

Essa classificação o coloca à frente de concorrentes como o Gemini 2.5 Pro do Google. (60%) e no mesmo nível de Claude Sonnet 4.5 da Anthropic (63%).

Para os desenvolvedores, isso significa acesso a um modelo poderoso e aberto que pode lidar com cenários sofisticados de codificação e uso de ferramentas sem ficar preso a um ecossistema proprietário.

O ‘Triângulo Impossível’: Equilibrando poder, velocidade e custo

Para anos, os desenvolvedores enfrentaram um equilíbrio entre a inteligência de um modelo, sua velocidade de inferência e seu custo operacional-um “triângulo impossível”.

MiniMax afirma que o M2 aborda diretamente esse desafio.

“Temos explorado se é possível criar um modelo que alcance um melhor equilíbrio entre desempenho, preço e velocidade, permitindo assim que mais pessoas se beneficiem do aumento de inteligência da era do Agente”, afirmou a equipe em um comunicado. postagem no blog.

A chave para esse equilíbrio é a arquitetura do modelo, que prioriza a economia computacional sem sacrificar a capacidade.

Ao desenvolver uma arquitetura de mistura de especialistas (MoE), o M2 aproveita um enorme pool de 230 bilhões de parâmetros totais, mas ativa apenas 10 bilhões para qualquer tarefa, de acordo com suas especificações técnicas.

O M2 é significativamente mais eficiente do que modelos rivais como o DeepSeek, que ativa 37 bilhões de parâmetros por token.

Essa escolha arquitetônica reduz drasticamente a sobrecarga computacional e os requisitos de memória, traduzindo-se diretamente em custos operacionais mais baixos e tempos de resposta mais rápidos.

O impacto económico poderá ser dramático. A MiniMax definiu seu preço de API em apenas US$ 0,30 por milhão de tokens de entrada e US$ 1,20 por milhão de tokens de saída.

Esse preço agressivo é de aproximadamente 8% do custo do Claude 3.5 Sonnet, enquanto a MiniMax afirma que o M2 oferece quase o dobro da velocidade de inferência.

Essa eficiência tem implicações profundas para o desenvolvimento de agentes de IA, onde loops de processamento mais rápidos e baratos permitem mais fluxos de trabalho complexos e responsivos, tornando ferramentas sofisticadas de IA mais acessíveis e escaláveis do que nunca.

A ofensiva de código aberto da China continua

Em um movimento que consolida ainda mais a liderança da China no espaço de IA de código aberto, a MiniMax disponibilizou totalmente os pesos do modelo M2 na plataforma do desenvolvedor Hugging Face.

MiniMax dá continuidade a uma tendência estabelecida por outras empresas chinesas como a DeepSeek, que buscaram agressivamente uma estratégia de código aberto para construir uma comunidade, impulsionar a adoção global e competir em meio à feroz guerra tecnológica EUA-China.

O código aberto fornece um caminho estratégico para empresas que enfrentam restrições de hardware, permitindo-lhes competir em inovação e custo.

Essa estratégia coloca o MiniMax em concorrência direta com seu rival doméstico, uma rivalidade que vem esquentando há algum tempo.

No início deste ano, o MiniMax lançou seu modelo M1 especificamente para desafiar o domínio do DeepSeek no espaço do modelo de raciocínio, enfatizando um Apache mais permissivo. 2.0 como um diferencial importante.

O lançamento do M2 impulsiona essa competição ainda mais, visando a mesma comunidade de desenvolvedores com uma oferta atraente de desempenho superior a um custo menor.

“O lançamento do MiniMax dá continuidade à liderança dos laboratórios chineses de IA em código aberto que o DeepSeek iniciou no final de 2024 e que foi continuado por lançamentos contínuos do DeepSeek, Alibaba, Z AI e Moonshot AI”, declarou Análise Artificial.

O lançamento faz parte de um padrão mais amplo de inovação da empresa, que possui um portfólio diversificado que inclui ferramentas de geração de vídeo e já estabeleceu benchmarks com modelos que quebram recordes Janelas de contexto de 4 milhões de tokens.

O foco da MiniMax em modelos de código aberto e de alta eficiência sinaliza um impulso estratégico para capturar uma fatia significativa do mercado. Ao resolver o equilíbrio crítico entre poder, velocidade e custo, o modelo M2 não apenas desafia a ordem estabelecida, mas também fornece aos desenvolvedores em todo o mundo uma nova ferramenta poderosa para construir a próxima geração de aplicativos orientados por IA.

Categories: IT Info