A equipe de qwen da

Alibaba lançou na terça-feira QWEN3-Coder, uma nova e poderosa série de modelos de codificação de IA de código aberto destinados diretamente a rivais como o Antrópico. Enclitada por uma enorme versão de 480 bilhões de parâmetro, os modelos são projetados para o trabalho”agêntico”, permitindo que eles lidem com tarefas complexas de desenvolvimento de software autonomamente. Defina um novo padrão para modelos abertos. No entanto, o lançamento também chega em meio ao profundo ceticismo da indústria sobre os benchmarks de IA, alimentados por alegações recentes de que outro dos modelos de Alibaba é enganado nos principais testes de desempenho. href=”https://huggingface.co/qwen/qwen3-coder-480b-a35b-struct”alvo=”_ blank”> qwen3-coder-480b-a35b-struct , um modelo de mistura massiva (MOE). Ele contém 480 bilhões de parâmetros totais, mas ativa apenas um subconjunto de 35 bilhões de parâmetros para qualquer tarefa. Esta arquitetura fornece imenso poder, mantendo a eficiência computacional.

A base do modelo foi construída com um colossal 7,5 trilhões de tokens de dados pré-treinamento, com uma proporção de 70% dedicada especificamente ao código. De acordo com a equipe QWEN, a qualidade dos dados era fundamental; Eles aproveitaram um modelo anterior, QWEN2.5-CODER, para limpar e reescrever sinteticamente os dados ruidosos para esta nova geração.

Suas especificações técnicas são formidáveis. O modelo possui um comprimento de contexto nativo de 256.000 toques, que pode ser estendido a um milhão de tokens usando métodos de extrapolação como fios. Essa vasta capacidade é adaptada para o entendimento em escala de repositório, permitindo que a IA compreenda o contexto completo de grandes projetos de software.

Essa consciência contextual é combinada com uma amplitude incrível. O modelo suporta uma grande variedade de linguagens de programação, desde opções convencionais como C ++, Python e Java a idiomas especializados como ABAP, Rust, e Swift, conforme detalhado em seu

Esta versão sinaliza o empurrão agressivo de Alibaba para a próxima fronteira de IA: Inteligência Agentica. A indústria está rapidamente indo além dos simples assistentes de código para agentes autônomos que podem planejar, executar e se adaptar a tarefas de desenvolvimento complexas e em várias etapas. QWEN3-Coder não é apenas um novo modelo; É uma entrada estratégica nessa crescente”corrida armamentista”.

A tendência já está sendo validada na empresa. O banco de investimentos Goldman Sachs, por exemplo, começou recentemente a pilotar o agente da IA Devin para construir uma”força de trabalho híbrida”. Seu chefe de tecnologia, Marco Argenti, descreveu um futuro em que”é realmente sobre pessoas e AIS trabalhando lado a lado. Espera-se que os engenheiros tenham a capacidade de realmente descrever os problemas de uma maneira coerente…”Mudando o foco humano de codificação tediosa para a solução de problemas de alto nível. Nos EUA, a Amazon revelou recentemente seu agente da Kiro para impor estrutura à caótica “codificação da vibração”, enquanto o Google busca um ataque duplo com seu estúdio abrangente de Firebase e uma cli de Gemini grátis. O OpenAI continua a atualizar seu agente do Codex, dando recentemente acesso à Internet a encontrar e usar dados de forma autônoma.

A competição é igualmente intensa na”Guerra de cem modelos”da China. O QWEN3-Coder está posicionado contra potências de código aberto como Moonshot AI, que lançou recentemente seu modelo Kimi K2 de 1 trilhão de parâmetros. Essa rivalidade doméstica é alimentada por pressões geopolíticas que forçam as empresas chinesas a construir ecossistemas autônomos. A startup de codificação Windsurf viu recentemente o Google roubar seu CEO e os melhores talentos, analisando uma aquisição do OpenAI, permitindo que a cognição rival adquirisse a empresa restante. Em um exemplo claro dessa”guerra de referência”, a Xai de Elon Musk contratou recentemente contratados para treinar seu modelo Grok 4 para vencer Claude da Anthrópica. Os imensos custos operacionais também são um fator, como visto quando os limites de uso mais apertados antropais para seus assinantes premium, destacando a tensão financeira de fornecer esses serviços poderosos. O momento é estranho para o Alibaba. Poume dias antes, em 18 de julho, Um estudo da Universidade Fudan alegou que seu modelo de QWEN2.5, que reivindicou o modelo, o que reivindicou o modelo de reivindicação de Mathied, que reivindicou o Memoroud ModelMark

Outros alertam sobre uma desconexão perigosa entre as pontuações dos testes e a utilidade do mundo real. Como observou o estrategista da IA Nate Jones,”no momento em que definimos o domínio da tabela de classificação como objetivo, corremos o risco de criar modelos que se destacam em exercícios triviais e linguados ao enfrentar a realidade”. Esse sentimento é ecoado por especialistas como Sara Hooker, chefe de laboratórios coere, que argumentaram que “quando uma tabela de classificação é importante para um ecossistema inteiro, os incentivos estão alinhados para que seja game”, criando um risco de que seja bom, mas com os exames, mas com os quedem, mas a adoção de um que está de acordo com a adoção de um que está de acordo com a adoção de um que está de acordo com a adoção de uma adoção de um que está de acordo com a adoção de uma adoção de um que está de acordo com a adoção de um que está de acordo com a adoção de uma adoção de um que está de acordo com a adoção de uma adoção de um que está de acordo com a adoção de uma adoção de um que está de acordo com as tarefas práticas. O Alibaba está lançando um conjunto de ferramentas ao lado dos modelos. A empresa lançou”Qwen Code”, uma interface de linha de comando bifurcada da CLI Gemini do Google e personalizada para os novos modelos. Isso fornece aos desenvolvedores um ambiente pronto para codificação agêntica. Notably, Qwen3-Coder can be used with Anthropic’s own Claude Code CLI, allowing developers to switch backends without disrupting their workflows.

This strategy of building an open, flexible ecosystem is crucial for ganhando a lealdade dos desenvolvedores. Ao tornar seus modelos poderosos acessíveis através de várias plataformas, incluindo sua própria API de estúdio , o alibaba está apostando que a utilidade e a utilidade de uso mostra melhorias significativas de referência . Esta liberação dupla ressalta a estratégia abrangente da Alibaba para competir em todas as frentes da corrida armamentista global da IA.

Categories: IT Info