O novo modelo de raciocínio QWEN3 do Alibaba no topo do OpenAi e do Google Benchmarks no grande lançamento de código aberto

Nesta semana, a equipe QWEN da Alibaba lançou um novo modelo de raciocínio de código aberto que está agitando a indústria da IA. Revestido em 25 de julho, o modelo QWEN3-235B-A22B-PINCING-2507 já liderou os principais benchmarks da indústria, superando sistemas proprietários poderosos de rivais como Google e OpenAI.

O lançamento marca uma mudança estratégica significativa para o gigante da tecnologia chinesa. Ele está abandonando sua abordagem anterior de”pensamento híbrido”para treinar modelos separados e especializados para raciocínio complexo e seguidores de instruções rápidas. Esse movimento visa proporcionar uma qualidade mais alta e fornecer aos desenvolvedores ferramentas de AI de última geração. Seu desempenho não se limita a um único nicho; Em vez disso, demonstra uma capacidade abrangente e poderosa em raciocínio, codificação e alinhamento de usuários complexos, definindo um novo padrão para o que a IA de código aberto pode alcançar.

No reino do raciocínio matemático e lógico avançado, o modelo provou ser excepcionalmente capaz. Na referência do AIME25, um teste projetado para avaliar habilidades sofisticadas e de solução de problemas em várias etapas, o QWEN3-RECUTING-2507 alcançou uma pontuação notável de 92,3. Isso o coloca à frente de alguns dos modelos proprietários mais poderosos, superando principalmente o Gemini-2.5 Pro do Google, que registrou uma pontuação de 88,0 na mesma avaliação.

A proezas do modelo se estende ao domínio crítico do desenvolvimento de software. Quando testado no LivecodeBench V6, uma referência que avalia a capacidade de uma IA de lidar com tarefas de codificação do mundo real, o QWEN3 com pensamento garantiu uma pontuação superior de 74.1. Esse desempenho o coloca confortavelmente à frente dos Gemini-12.5 Pro (72,5) e do OpenAI-Mini (71,8), demonstrando sua utilidade prática para desenvolvedores e equipes de engenharia. O primeiro lugar ficou no primeiro lugar na referência Arena-Hard V2, que mede que os usuários de modelos preferem em comparações frente a frente. Essa pontuação principal de 79,7 indica não apenas uma habilidade técnica forte, mas também um alto grau de utilidade, coerência e segurança em suas respostas geradas. Raciocínio

Esta liberação de referência representa um grande pivô estratégico para a divisão de IA do Alibaba, sinalizando uma evolução deliberada e cuidadosamente considerada em sua filosofia de desenvolvimento. A empresa anunciou que está abandonando oficialmente o modo de”pensamento híbrido”, que era uma característica central de seus modelos QWEN3 anteriores. Essa abordagem inicial exigia que os desenvolvedores alterassem manualmente entre os modos rápidos de seguir instruções e raciocínio profundo usando tokens especiais, um sistema que poderia introduzir complexidade e inconsistência. In a formal statement, Alibaba Cloud explained the change, stating, “after discussing with the community and reflecting on the Matéria, decidimos abandonar o modo de pensamento híbrido. Os modelos”Instruct”podem ser ajustados para a velocidade e a execução sem falhas dos comandos diretos, enquanto os modelos de”pensamento”podem ser treinados exclusivamente em tarefas complexas de raciocínio de várias etapas. Isso resulta em maior consistência, maior clareza para os desenvolvedores e, finalmente, o desempenho superior de referência demonstrado por este novo lançamento. Enquanto o modelo contém um enorme 235 bilhão de parâmetros totais, fornecendo um imenso repositório de conhecimento, ele ativa apenas um subconjunto magro de 22 bilhões de parâmetro para qualquer tarefa. Modelos. Essa vasta capacidade permite que o modelo processe e raciocine quantidades enormes de informações em um único passe, como analisar repositórios de código de software inteiros, digerindo longos documentos legais ou financeiros ou mantendo um recall perfeito sobre interações complexas e complexas sem perder o fio da conversa. Dos aspectos mais significativos do lançamento, é o seu licenciamento. QWEN3-PINCING-2507 é Disponível sob a licença Apache 2.0 , um acordo altamente permissivo e comercialmente amigável. Isso permite que as organizações baixem, modifiquem e implantem livremente o modelo. Ele fornece às empresas controle total sobre sua privacidade, segurança, custo e latência de dados, abordando as principais preocupações das empresas que operam em indústrias regulamentadas ou com informações confidenciais. O Preço é definido em US $ 0,70 por um milhão de tokens e US $ 8,40 por milhão de tokens , com um número de tokens de US $ 0,70, com um poço de um número. href=”https://openrouter.ai/models/qwen/qwen3-235b-a22b-thinking-2507″Target=”_ Blank”> Acesse o modelo através de plataformas como o OpenRouter . É Compatível com estruturas Agentic como Qwen-Agent , facilitando a integração em fluxos de trabalho complexos, que requerem planejamento e ferramenta. Óculos

O modelo QWEN3-REQUISTO é o mais recente em uma rápida sucessão de lançamentos do Alibaba. A equipe de Qwen também lançou recentemente um novo modelo de codificador de 480B de 480B e um modelo de tradução multilíngue, construindo um ecossistema abrangente de IA de código aberto. A estratégia parece ser um conjunto completo de ferramentas poderosas e abertas para desenvolvedores.

O momento deste lançamento foi claramente estratégico. Chegou apenas um dia antes do Alibaba visualizar seus novos óculos inteligentes”Quark AI”na Conferência Mundial de Inteligência Artificial em Xangai. Os óculos são alimentados pela nova série QWEN3, um movimento projetado para mostrar a aplicação do mundo real de sua poderosa IA. Ao provar seus recursos de IA de classe mundial pouco antes de revelar o hardware, o Alibaba executou um”programa, não conte”para criar confiança no mercado.

O novo modelo de raciocínio QWEN3 do Alibaba no topo do OpenAi e do Google Benchmarks no grande lançamento de código aberto

Published by All Things Windows on July 27, 2025

IT Info

Meta revela a pulseira para controle de gestos, traduzindo movimentos musculares em comandos

IT Info

Microsoft afirma

IT Info

Electron E1 Chip do computador eficiente promete 100x eficiência energética com nova arquitetura radical

O novo modelo de raciocínio QWEN3 do Alibaba no topo do OpenAi e do Google Benchmarks no grande lançamento de código aberto

Published by All Things Windows on July 27, 2025

Related Posts

IT Info

Meta revela a pulseira para controle de gestos, traduzindo movimentos musculares em comandos

IT Info

Microsoft afirma

IT Info

Electron E1 Chip do computador eficiente promete 100x eficiência energética com nova arquitetura radical