A Microsoft tem introduziu três novos modelos em sua família Phi-3 de modelos de linguagem pequena (SLMs): Phi-3-small e Phi-3-medium já estão disponíveis, e Phi-3-vision é um novo modelo. Esses modelos são projetados para serem eficientes e poderosos, atendendo a vários ambientes com recursos limitados, como cenários de inferência no dispositivo, na borda e offline. A Microsoft anunciou inicialmente a família Phi-3 no mês passado.
Capacidades e otimização
Os modelos Phi-3 são projetados para oferecer alto desempenho e, ao mesmo tempo, serem econômicos. Eles são otimizados para ambientes onde tempos de resposta rápidos são essenciais, tornando-os adequados para dispositivos móveis e outras plataformas com recursos computacionais limitados. Essa otimização garante que os modelos possam operar com eficiência sem consumir memória excessiva ou poder de processamento.
Phi-3-Vision: um modelo multimodal
Entre os novos lançamentos, o Phi-3-Vision se destaca como um modelo multimodal capaz de processar tanto texto quanto imagens. Este modelo, que possui 4,2 bilhões de parâmetros, se destaca em tarefas gerais de raciocínio visual. Ao contrário de outros modelos de IA que geram imagens, o Phi-3 Vision se concentra na compreensão e análise de dados visuais, tornando-o útil para tarefas como interpretação de tabelas e gráficos.
[conteúdo incorporado]
A Microsoft integrou o modelo Phi-3-mini em seu Plataforma de modelos como serviço (MaaS) da Azure AI. Esta integração permite que os utilizadores aproveitem as capacidades do Phi-3-mini para várias aplicações através da infraestrutura do Azure. Além disso, a Microsoft está aprimorando suas ofertas de API para oferecer suporte a experiências multimodais, permitindo aplicações de IA mais versáteis.
Novos recursos no Azure AI Speech
Em conjunto com o Anúncios do modelo Phi-3, a Microsoft também está apresentando novos recursos para o Azure AI Speech. Esses recursos incluem análise de fala e tradução universal, destinadas a ajudar os desenvolvedores a criar aplicativos habilitados para voz de alta qualidade. Espera-se que essas melhorias forneçam ferramentas mais robustas para processamento e análise de fala.
A família Phi-3 foi introduzida inicialmente em abril com o lançamento do Phi-3-mini, um modelo com 3,8 bilhões de parâmetros. As novas adições, Phi-3-small e Phi-3-medium, possuem 7 bilhões e 14 bilhões de parâmetros, respectivamente. Esses modelos são projetados para serem menos intensivos em computação, o que os torna adequados para uma ampla variedade de dispositivos, incluindo smartphones e laptops.