A

A Microsoft apresentou dois novos modelos de IA desenvolvidos internamente, marcando uma etapa significativa em sua estratégia para construir IA proprietária, juntamente com sua parceria com o OpenAI. Anunciados na quinta-feira, os modelos incluem Mai-Voice-1, uma ferramenta de geração de fala altamente eficiente e a previsão Mai-1, o primeiro modelo de texto fundamental de ponta a ponta da empresa. Os novos modelos sinalizam a ambição da Microsoft de se tornar um líder tanto na aplicação da IA ​​quanto na pesquisa fundamental, dando-lhe maior controle sobre seu roteiro tecnológico. Ele ressalta um pivô estratégico para o desenvolvimento de recursos internos para complementar seu investimento em vários bilhões de dólares no Openai. A nova voz hiper-eficiente para copiloto

O primeiro dos novos modelos, Mai-voice-1, está posicionado como um sistema de geração de fala”altamente expressivo e natural”. O anúncio oficial da Microsoft destaca sua notável eficiência, alegando que ele pode Gere um minuto inteiro de áudio de alta fidelidade em um segundo em um único GPU. Essa métrica de desempenho o torna um dos sistemas de fala mais eficientes e”rápidos”disponíveis hoje. O MAI-VOICE-1 foi projetado para oferecer essa visão, produzindo áudio expressivo adequado para cenários únicos e multi-falantes, uma capacidade-chave para criar experiências de IA dinâmicas e interativas.

Este não é apenas um projeto de pesquisa; A tecnologia já está sendo integrada à linha de produtos da Microsoft. Atualmente, o MAI-VOICE-1 está alimentando os recursos do Copilot Daily e podcasts, trazendo vozes mais naturais e envolventes para usuários que interagem diariamente com esses serviços. Essa experiência permite que qualquer pessoa Pasta texto, selecione Vozes e Styles e baixe a saída . A empresa sugere casos de uso da criação de histórias de”Escolha sua própria aventura”para meditações guiadas. Microsoft describes it as its first foundation model trained de ponta a ponta inteiramente dentro de seus próprios laboratórios. Esse movimento é uma etapa crítica na construção do músculo de desenvolvimento independente de IA e oferece o que a empresa chama de “vislumbre de futuras ofertas dentro do copiloto.”

O modelo é construído sobre uma arquitetura sofisticada da mistura de especialistas (MOE), uma técnica conhecida para equilibrar imenso energia com eficiência computacional. Seu desenvolvimento envolveu um enorme investimento de hardware, pois foi pré-treinado e pós-treinado em um agrupamento de aproximadamente 15.000 dos GPUs H100 altamente procurados da NVIDIA. A empresa afirma que o modelo se destaca em se especializar em seguir as instruções e fornecer respostas úteis às perguntas do usuário diário, posicionando-o como uma ferramenta prática e útil para um público amplo. Ele abriu o Mai-1-Preview para o escrutínio público em Lmarena, uma plataforma comunitária popular para o benchmarking de modelos de IA um contra o outro. Essa abordagem transparente permite comparação direta e feedback imparcial da comunidade de IA mais ampla. Nas próximas semanas, ele será lançado para lidar com certas tarefas baseadas em texto no Copilot. O objetivo declarado é aprender com o feedback do usuário para melhorar o modelo. Para desenvolvedores e pesquisadores, a Microsoft também está oferecendo Acesso limitado Acesso através de um processo de aplicação Para reunir mais informações técnicas.

Apesar desse grande impulso para a IA de casa, a Microsoft está reafirmando publicamente seu compromisso com o OpenAI. Os executivos da empresa ficaram claro que a previsão de MAI-1 não se destina a substituir os poderosos modelos GPT que atualmente sustentam muitos de seus serviços. Isso sugere uma estratégia de diversificação em vez de substituição, onde a Microsoft pode escolher a melhor ferramenta para qualquer tarefa, seja de um parceiro, da comunidade de código aberto ou de seus próprios laboratórios. O post oficial do blog da empresa ecoou esse sentimento, destacando uma missão de criar um imenso impacto positivo. A equipe da Microsoft AI declarou:”Também temos a sorte de fazer parceria com equipes de produtos incríveis, dando aos nossos modelos a chance de alcançar bilhões de usuários e criar imenso impacto positivo”.

O investimento em infraestrutura solidifica ainda mais essa visão de longo prazo. A Microsoft confirmou que seu cluster de próxima geração do NVIDIA GB200 GPUS agora está operacional, abrindo caminho para modelos ainda mais ambiciosos. Suleyman confirmou a dedicação da empresa, dizendo:”Temos um enorme roteiro de cinco anos que estamos investindo no trimestre após trimestre. Então, acho que isso vai continuar”. A OpenAI recentemente atualizou seus próprios recursos de voz com sua API em tempo real, enquanto empresas como antropia, Mistral e até Amazon estão disputando o domínio no campo em rápida evolução da IA ​​generativa. A mudança da Microsoft é um sinal claro de que pretende competir em todas as frentes.

Categories: IT Info