O Tongyi Lab do
Alibaba apresentou o modelo R1-OMNI, um modelo de inteligência artificial de código aberto (AI) capaz de interpretar emoções humanas por meio da análise de dados visuais e auditivos.
r1-omni utiliza o aprendizado de reforço com recompensa verificável (RLVR), aumentando seu raciocínio, precisão e adaptabilidade. O modelo posiciona o Alibaba juntamente com os principais concorrentes de IA como Openai e Deepseek, marcando um avanço estratégico no setor de modelos de IA. A empresa afirma : “R1-omni é a primeira aplicação do setor de aprendizado de reforço com recompensa verificável (RLVR) a um modelo de linguagem grande omni-multimodal. Nós nos concentramos no reconhecimento de emoção, uma tarefa em que as modalidades visuais e de áudio desempenham papéis cruciais, para validar o potencial de combinar o RLVR com o modelo OMNI. > rlvr e como ele avança o aprendizado de R1-OMNI
rlvr opera recompensando o modelo de IA apenas quando as saídas atendem aos critérios verificáveis, garantindo que o processo de aprendizagem do modelo seja guiado por um complexo de aprendizagem
O processo de treinamento do modelo incorporou grandes conjuntos de dados como MAFW e DFEW, apresentando mais de 15.000 amostras de vídeo, melhorando sua capacidade de generalizar o reconhecimento em diversos cenários. Otimização (GRPO) , reduzindo a dependência de modelos de críticos tradicionais, permitindo avaliações comparativas mais rápidas.
Essa abordagem foi projetada para acelerar o processo de aprendizado sem comprometer o desempenho, garantindo que o R1-OMNI possa processar dados complexos com mais eficiência e oferecer precisão consistente ao reconhecimento de emoções. Em janeiro de 2025, o Alibaba lançou o QWEN 2.5-MAX, um modelo de mistura de especialistas (MOE) projetado para melhorar o raciocínio e a solução de problemas. O modelo é totalmente compatível com a API do OpenAI, fornecendo aos desenvolvedores uma opção de integração perfeita para aplicativos de IA escaláveis. Enquanto o Alibaba reteve dados de referência, enfatizou o design do modelo para eficiência computacional-um atributo crítico, considerando as restrições dos EUA nas exportações avançadas de hardware de IA. Esse modelo atende especificamente aos desenvolvedores que trabalham em ambientes computacionais restritos, reforçando o compromisso da Alibaba com ferramentas de IA escaláveis e acessíveis. Com o objetivo de manter o momento competitivo em meio a pressões regulatórias e de mercado. A Deepseek vem navegando no aumento do escrutínio dos reguladores europeus sobre a conformidade com o GDPR e enfrentando discussões nos EUA sobre possíveis restrições vinculadas a preocupações de segurança nacional. Embora afirme ter confiado apenas em 2.048 GPUs da NVIDIA H800 para treinar seu modelo de raciocínio R1, houve especulações sobre se a empresa armazenou hardware restrito antes das sanções.
A estratégia de código aberto e preços da Alibaba: moldar a dinâmica competitiva
A abordagem da Alibaba para o desenvolvimento de IA de código aberto desempenha um papel fundamental em sua estratégia para expandir a acessibilidade e a influência da indústria. O lançamento do modelo de vídeo WAN 2.1 AI no início deste ano ressalta esses esforços.
Ao fornecer alternativas de código aberto a plataformas proprietárias como o SORA do OpenAI e o VEO 2 do Google, o Alibaba está se posicionando como um dos principais defensores da inovação de IA acessível. Essa abordagem de código aberto não apenas reduz as barreiras para os desenvolvedores, mas também adiciona impulso à expansão do ecossistema de AI de longo prazo do Alibaba. Em dezembro de 2024, a empresa reduziu os preços dos seus modelos QWEN-VL em 85%, aumentando a acessibilidade para empresas e desenvolvedores. Em dezembro de 2024, a empresa reduziu o preço de seus modelos QWEN-VL em 85%, tornando sua IA mais acessível. Ao combinar acesso de código aberto com preços competitivos, a Alibaba fortalece sua posição entre desenvolvedores e empresas, oferecendo soluções que são escaláveis e economicamente viáveis. O próximo modelo R2 da Deepseek será avaliado de perto quanto à sua precisão e eficiência de raciocínio, especialmente em meio a pressões regulatórias e limitações de hardware. Enquanto isso, a ênfase do Alibaba em modelos de IA explicáveis como R1-OMNI e suas iniciativas de código aberto a posicionam como líder na definição de novos padrões da indústria para acessibilidade e eficiência.