A Microsoft revelou seu a mais recente inovação em inteligência artificial, a série de modelos Phi-3, marcando um avanço significativo no campo de modelos leves de IA. A nova série inclui o Phi-3 Mini, com 3,8 bilhões de parâmetros; o Phi-3 Small, com 7 bilhões de parâmetros; e o Phi-3 Medium, com 14 bilhões de parâmetros. Esses modelos representam a próxima evolução no desenvolvimento de IA da Microsoft, seguindo o modelo Phi-2 introduzido em dezembro de 2023. A série Phi-3 foi desenvolvida em resposta aos avanços competitivos, notadamente a família Llama-3 da Meta, empregando técnicas mais recentes no aprendizado curricular para melhoram o desempenho e a eficiência.

Aprimoramentos e desempenho

O Phi-3 Mini, apesar de seu tamanho relativamente pequeno, demonstra notáveis ​​melhorias de desempenho em relação ao seu antecessor, o modelo Phi-2, e até mesmo supera modelos maiores de concorrentes como Llama da Meta e GPT-3 da OpenAI, de acordo com benchmarks da Microsoft. Treinado em 3,3 trilhões de tokens, o Phi-3 Mini alcança pontuações impressionantes em benchmarks acadêmicos e testes internos, rivalizando com modelos maiores como Mixtral 8x7B e GPT-3.5. Por exemplo, ele obteve 69% no benchmark MMLU e 8,38 no MT-bench, demonstrando sua eficiência e capacidade. Os modelos Phi-3 Small e Phi-3 Medium, treinados em 4,8 trilhões de tokens, oferecem melhorias ainda mais significativas no desempenho, indicando um escalonamento promissor de parâmetros dentro da série Phi-3.

Implantação e Aplicativo

A Microsoft enfatiza a otimização da série Phi-3 para dispositivos de baixo consumo de energia, com o Phi-3 Mini sendo capaz de executar tarefas avançadas de processamento de linguagem natural diretamente em smartphones. Este desenvolvimento abre novos caminhos para aplicações de IA em ambientes onde o poder computacional é limitado. Apesar do tamanho menor e do menor consumo de energia, os modelos Phi-3 mantêm uma alta qualidade de desempenho, embora não possuam a extensa base de conhecimento de modelos maiores treinados na Internet. O vice-presidente da Microsoft, Eric Boyd, disse ao The Verge. a> que o equilíbrio entre tamanho e qualidade, observando que modelos menores e de alta qualidade geralmente apresentam melhor desempenho devido à escala mais focada e limitada dos conjuntos de dados internos.

Categories: IT Info