Alibaba Cloud anunciou uma redução de 85% no preço de seu modelo de IA de raciocínio visual, Qwen-VL-Max. A Qwen-VL-Max a 0,003 yuan (US$ 0,00041) por mil tokens, reflete a estratégia agressiva da ByteDance para reduzir custos de seus modelo de IA de raciocínio visual lançado no início de dezembro.

A série Qwen-VL do Alibaba abrange vários outros modelos avançados que integram dados visuais e textuais para tarefas como legendagem de imagens, resposta visual a perguntas e geração de conteúdo multimodal. A programação inclui Qwen-VL, Qwen-VL-Chat, Qwen2-VL e o experimental QVQ-72B-Preview. Qwen2-VL, com seu desempenho de última geração, se destacou em benchmarks como MathVista e DocVQA, muitas vezes superando concorrentes líderes como GPT-4V da OpenAI e Gemini Ultra do Google.

Com mais de 252 IA generativa modelos aprovados na China este ano, seu mercado ficou saturado, levando as empresas a adotar estratégias inovadoras de preços e tecnologia para garantir participação de mercado.

Preços Estratégicos como um Padrão Consistente

O anúncio de dezembro é o terceiro grande ajuste de preços de IA do Alibaba em 2024, após uma redução de 55% em fevereiro para os principais produtos de nuvem e um desconto de 97% em maio para o pacote Qwen AI. Estas medidas refletem um foco consistente na acessibilidade, com o objetivo de atrair clientes empresariais que exploram ferramentas avançadas de IA para processos de negócios e análises.

Ao reduzir custos, a Alibaba procura posicionar as suas ofertas de IA como ferramentas indispensáveis ​​para empresas que enfrentam complexidades. de adotar inteligência artificial. O faturamento baseado em token, que cobra dos usuários por interações específicas de IA, tornou-se central nas estratégias de preços, permitindo acesso escalável a modelos poderosos sem investimentos iniciais proibitivos.

Avanço da IA ​​multimodal com QVQ-72B

No início desta semana, o Alibaba apresentou o QVQ-72B, um modelo de IA multimodal de código aberto que integra capacidades de raciocínio visual e textual. Esta versão baseia-se no seu antecessor, Qwen2-VL-72B, melhorando a funcionalidade para pesquisa científica e análises avançadas.

Os benchmarks validaram as capacidades do QVQ-72B, com o modelo alcançando uma pontuação de 70,3 no benchmark MMMU— um teste desenvolvido para avaliar o raciocínio multimodal de nível universitário – e com excelência em MathVista e OlympiadBench. Esses resultados colocam o QVQ-72B entre os modelos de código aberto mais competitivos do setor.

QwQ-32B: um modelo para precisão lógica

Em novembro , Alibaba introduziu o QwQ-32B, um modelo adaptado para raciocínio lógico, codificação e tarefas matemáticas avançadas. Seu recurso de computação em tempo de teste aloca recursos computacionais adicionais durante a execução, melhorando a precisão de problemas complexos. Embora isso reduza os tempos de resposta, a precisão oferecida pelo QwQ-32B foi elogiada em benchmarks e aplicações empresariais.

O lançamento do QwQ-32B sob a licença Apache 2.0 reflete o compromisso da Alibaba em equilibrar colaboração e controle proprietário. Ao focar na IA centrada no raciocínio, o Alibaba compete diretamente com modelos como o R1-Lite-Preview da DeepSeek e o modelo o1 da OpenAI, que priorizam a profundidade lógica e a resolução iterativa de problemas.

O setor de IA generativa da China testemunhou uma rápida proliferação de modelos, com mais de 250 ofertas aprovadas para uso público somente em 2024. Essa saturação alimentou uma intensa competição entre líderes do setor e startups, cada um disputando diferenciação por meio de preços e recursos tecnológicos exclusivos.

A DeepSeek, por exemplo, enfatizou a transparência com seu modelo R1-Lite-Preview, que usa o raciocínio de cadeia de pensamento para dividir os problemas em etapas incrementais, permitindo que os usuários acompanhem seu processo de tomada de decisão. Enquanto isso, a ByteDance e a Alibaba concentram-se na acessibilidade para impulsionar a adoção num mercado cada vez mais concorrido.

Categories: IT Info