Microsoft expande família de modelos Phi-3 AI com novos recursos multimodais

A Microsoft tem introduziu três novos modelos em sua família Phi-3 de modelos de linguagem pequena (SLMs): Phi-3-small e Phi-3-medium já estão disponíveis, e Phi-3-vision é um novo modelo. Esses modelos são projetados para serem eficientes e poderosos, atendendo a vários ambientes com recursos limitados, como cenários de inferência no dispositivo, na borda e offline. A Microsoft anunciou inicialmente a família Phi-3 no mês passado.

Capacidades e otimização

Os modelos Phi-3 são projetados para oferecer alto desempenho e, ao mesmo tempo, serem econômicos. Eles são otimizados para ambientes onde tempos de resposta rápidos são essenciais, tornando-os adequados para dispositivos móveis e outras plataformas com recursos computacionais limitados. Essa otimização garante que os modelos possam operar com eficiência sem consumir memória excessiva ou poder de processamento.

Phi-3-Vision: um modelo multimodal

Entre os novos lançamentos, o Phi-3-Vision se destaca como um modelo multimodal capaz de processar tanto texto quanto imagens. Este modelo, que possui 4,2 bilhões de parâmetros, se destaca em tarefas gerais de raciocínio visual. Ao contrário de outros modelos de IA que geram imagens, o Phi-3 Vision se concentra na compreensão e análise de dados visuais, tornando-o útil para tarefas como interpretação de tabelas e gráficos.

[conteúdo incorporado]

A Microsoft integrou o modelo Phi-3-mini em seu Plataforma de modelos como serviço (MaaS) da Azure AI. Esta integração permite que os utilizadores aproveitem as capacidades do Phi-3-mini para várias aplicações através da infraestrutura do Azure. Além disso, a Microsoft está aprimorando suas ofertas de API para oferecer suporte a experiências multimodais, permitindo aplicações de IA mais versáteis.

Novos recursos no Azure AI Speech

Em conjunto com o Anúncios do modelo Phi-3, a Microsoft também está apresentando novos recursos para o Azure AI Speech. Esses recursos incluem análise de fala e tradução universal, destinadas a ajudar os desenvolvedores a criar aplicativos habilitados para voz de alta qualidade. Espera-se que essas melhorias forneçam ferramentas mais robustas para processamento e análise de fala.

A família Phi-3 foi introduzida inicialmente em abril com o lançamento do Phi-3-mini, um modelo com 3,8 bilhões de parâmetros. As novas adições, Phi-3-small e Phi-3-medium, possuem 7 bilhões e 14 bilhões de parâmetros, respectivamente. Esses modelos são projetados para serem menos intensivos em computação, o que os torna adequados para uma ampla variedade de dispositivos, incluindo smartphones e laptops.

Microsoft expande família de modelos Phi-3 AI com novos recursos multimodais

Published by All Things Windows on May 21, 2024

Capacidades e otimização

Phi-3-Vision: um modelo multimodal

Novos recursos no Azure AI Speech

IT Info

Como desativar a tela de bloqueio no Windows 11

IT Info

Como abrir e extrair arquivos TGZ no Windows 11 e 10

IT Info

Como remover a página inicial do painel de navegação do File Explorer no Windows 11

Microsoft expande família de modelos Phi-3 AI com novos recursos multimodais

Published by All Things Windows on May 21, 2024

Capacidades e otimização

Phi-3-Vision: um modelo multimodal

Novos recursos no Azure AI Speech

Related Posts

IT Info

Como desativar a tela de bloqueio no Windows 11

IT Info

Como abrir e extrair arquivos TGZ no Windows 11 e 10

IT Info

Como remover a página inicial do painel de navegação do File Explorer no Windows 11