A Microsoft disponibilizou oficialmente o GPT-4 Turbo com Vision para todos os clientes do Azure OpenAI Service, marcando um passo à frente na integração de modelos avançados de IA em processos de negócios. Este desenvolvimento, conforme detalhado em postagem recente no blog da empresa, permite que clientes nas regiões Suécia Central e Leste dos EUA 2 Azure OpenAI implantem o “gpt-4-turbo-2024-04-09″. Este modelo foi projetado para aprimorar as operações de negócios, aproveitando o poder da IA ​​para compreender e interpretar imagens e texto de maneira unificada. O lançamento ocorre após a integração na visualização em dezembro passado. 

Aplicativos e recursos

A implantação do GPT-4 Turbo com Vision já viu uma ampla gama de aplicações em vários setores. Os varejistas estão usando o modelo para melhorar as experiências de compras on-line, enquanto as empresas de mídia e entretenimento. estão utilizando-o para gerenciar ativos digitais de forma mais eficaz. Além disso, o modelo auxilia diversas organizações na extração de insights de gráficos e diagramas, mostrando sua versatilidade no processamento de informações visuais. Apesar da ausência de certos recursos na visualização pública, como reconhecimento óptico de caracteres (OCR), aterramento de objetos, prompts de vídeo e recursos específicos de processamento de dados de imagem, a Microsoft está empenhada em integrar esses recursos em atualizações futuras. A próxima inclusão do”modo JSON e chamada de função para solicitações de inferência envolvendo entradas de imagem (visão)”promete aprimorar ainda mais a utilidade do modelo.

O GPT-4V introduz vários recursos importantes projetados para agilizar o processo de desenvolvimento. Notavelmente , ele oferece suporte ao modo JSON e à chamada de função, facilitando a integração com bases de código existentes. O modelo mantém os impressionantes 128.000 tokens na janela de contexto de seu antecessor, GPT-4 Turbo, permitindo o processamento extensivo de dados em uma única solicitação. imagens por meio de links diretos ou passando imagens codificadas em base64, expandindo a utilidade do modelo em vários aplicativos.

Preços e desenvolvimentos futuros

A Microsoft definiu o preço do GPT-4 Turbo com Vision em US$ 0,01 por 1.000 tokens de entrada e US$ 0,03 por 1.000 tokens para saída, com custos adicionais para recursos aprimorados. Esta estratégia de preços visa tornar a tecnologia acessível a uma ampla gama de usuários, desde startups até grandes empresas, facilitando a inovação e melhorias de eficiência em todos os setores.

Categories: IT Info