O Google lançou o Gemini 1.5 Pro como parte de sua assinatura paga Gemini Advanced, trazendo uma série de novos recursos para a plataforma. A atualização durante o Google I/O 2024 inclui uma longa janela de contexto começando com 1 milhão de tokens, geração de código aprimorada, raciocínio lógico, conversação multiturno e compreensão aprimorada de áudio e imagem.
Gemini Advanced com Gemini 1.5 Pro
O Gemini Advanced agora pode lidar com vários documentos grandes de até 1.500 páginas ou resumir 100 e-mails. Os usuários podem fazer upload de arquivos via Google Drive ou diretamente de seus dispositivos para obter informações sobre documentos densos. O Google enfatiza que os arquivos dos usuários permanecem privados e não são usados para treinar seus modelos.
Um recurso futuro permitirá que os usuários carreguem e entendam planilhas e outros arquivos de dados, permitindo análises e visualizações personalizadas. Esse recurso será compatível com Planilhas Google, CSVs e arquivos Excel e deverá ser lançado nas próximas semanas.
[conteúdo incorporado]
O Gemini 1.5 Pro também melhora a compreensão das imagens, permitindo que os usuários para tirar uma foto de um prato e obter uma receita ou tirar uma foto de um problema de matemática para obter instruções passo a passo. Além disso, em breve ele lidará com uma hora de conteúdo de vídeo ou bases de código com mais de 30.000 linhas.
Extensões Gemini
O Google está expandindo Extensões Gemini para incluir Google Calendar, Tasks, Keep e outros utilitários como o aplicativo Clock. Por exemplo, os usuários podem tirar uma foto de uma programação impressa e fazer com que o Gemini crie eventos no Agenda.
A extensão do YouTube Music, que permite aos usuários pesquisar músicas mencionando um verso favorito ou um artista em destaque, também será lançada hoje.. Essas novas extensões juntam-se às existentes para Gmail, Drive, Docs, Google Flights, Hotels, Maps e YouTube, e estão disponíveis para usuários Gemini gratuitos e pagos.
‘Gems’personalizadas do Gemini
Nos próximos meses, os usuários do Gemini Advanced e clientes empresariais poderão criar “Gems”, ou versões personalizadas do Gemini. parceiro de codificação ou guia de redação criativa Os usuários podem descrever a função e a personalidade do Gem desejado, e o Gemini o criará com base nessas instruções.
Gems pré-fabricados, como o Learning Coach, estarão disponíveis para todos os usuários do Gemini. aumentando a versatilidade da plataforma.
Planejador Imersivo para Gemini Advanced
O Gemini Advanced apresentará em breve um “planejador imersivo” na web, capaz de criar planos personalizados, itinerários baseados em linha do tempo. Esta ferramenta de planejamento integrará informações de voo do Gmail, recomendações locais do Google Maps e outras atividades, apresentando-as em uma interface de usuário dinâmica para fácil edição.
Atualizações para desenvolvedores: Gemini 1.5 Flash e Gemma 2
O Google também lançou o Gemini 1.5 Flash, sua IA multimodal mais rápida e versátil modelo. Com a mesma janela de contexto de 1 milhão, ele foi projetado para casos de uso de baixa latência e econômicos, como resumo, aplicativos de bate-papo e extração de dados. O Flash se junta a outros modelos, como Gemini Nano, Pro e Ultra, e está disponível por meio da API Gemini no Google AI Studio.
O Google também está visualizando uma janela de contexto de 2 milhões para o Gemini 1.5 Pro e adicionou recursos como chamada de função paralela e extração de quadros de vídeo nativos. Um recurso de cache de contexto estará disponível em breve, ideal para cenários como brainstorming de ideias de conteúdo ou análise de documentos complexos.
Além disso, o Google provocou Gemma 2, um modelo de parâmetros de 27B que supera modelos maiores e roda em um único TPUv5e, e PliGemma que é um modelo de linguagem de visão (VLM) versátil e leve. A empresa também anunciou sua TPU de 6ª geração, “Trillium”, que oferece um aumento significativo no desempenho máximo de computação por chip em comparação com TPU v5e.
Assinatura e disponibilidade
A assinatura Gemini Advanced, que custa US$ 20 por mês com um teste gratuito de dois meses, agora está disponível em mais de 35 idiomas e 150 países. O Google planeja doar dois milhões de tokens ao Gemini Advanced ainda este ano, melhorando sua capacidade de lidar com arquivos maiores e tarefas mais complexas.