Apenas alguns dias depois dos rumores de que seria adiado, o Google apresentou oficialmente sua resposta vigorosa à decisão da Microsoft e os avanços da OpenAI em IA generativa com um novo conjunto de modelos denominados coletivamente Gemini. A gigante da tecnologia desenvolveu três versões distintas do modelo Gemini AI, cada uma visando diferentes níveis de complexidade computacional e ambientes de aplicação.
[conteúdo incorporado]
O Portfólio Gemini: Ultra, Pro e Nano
Na vanguarda do anúncio do Google está o Gemini Ultra, criado para lidar com “tarefas altamente complexas”com uma vantagem de desempenho acentuada. Enquanto isso, o Gemini Pro tem como objetivo fornecer funcionalidades robustas e versáteis em um espectro mais amplo de tarefas. Em contraste , o Gemini Nano foi projetado com um objetivo mais focado: levar recursos de IA diretamente aos dispositivos por meio de tarefas que exigem menos peso computacional.
O Google afirma que o Gemini Ultra supera o GPT-4 da OpenAI, o atual mecanismo por trás do Copilot da Microsoft, na maioria de benchmarks significativos de modelos de linguagem. Em um movimento estratégico para entrelaçar diferentes tipos de dados, o Google desenvolveu o Gemini com recursos multimodais desde o início, garantindo que ele pudesse compreender e processar entradas como texto, imagens, áudio e vídeo de forma mais abrangente do que qualquer modelo existente de tipo semelhante.
[conteúdo incorporado]
Implicações para programadores e consumidores
O Google destaca as proezas do modelo com código, afirmando que o lançamento inaugural versão do Gemini pode compreender e gerar trechos de código de qualidade de forma autônoma em linguagens de programação amplamente utilizadas, como Python, Java, C++ e Go. Este aspecto o marca como um modelo fundamental líder para aplicativos de codificação.
“Temos testado rigorosamente nossos modelos Gemini e avaliado seu desempenho em uma ampla variedade de tarefas”, explica o Google em seu anúncio. imagem natural, compreensão de áudio e vídeo até raciocínio matemático, o desempenho do Gemini Ultra excede os resultados atuais de última geração em 30 dos 32 benchmarks acadêmicos amplamente utilizados em pesquisa e desenvolvimento de modelos de linguagem grande (LLM).
Com uma pontuação de 90,0%, o Gemini Ultra é o primeiro modelo a superar os especialistas humanos em MMLU ( compreensão massiva de linguagem multitarefa), que usa uma combinação de 57 disciplinas como matemática, física, história, direito, medicina e ética para testar o conhecimento mundial e as habilidades de resolução de problemas.”
Simultaneamente, a empresa desenvolveu lançou uma atualização em seu chatbot Bard, incorporando Gemini Pro para enriquecer os recursos avançados de raciocínio e compreensão da ferramenta, inicialmente disponível em inglês. O Google prevê melhorias adicionais com a integração futura do Gemini Ultra ao Bard, prometendo recursos ainda mais sofisticados.
[conteúdo incorporado]
Os usuários do Pixel 8 Pro também experimentarão a força do Gemini modelo, já que o Google lança uma atualização de recurso que injeta o Gemini Nano no dispositivo no smartphone. Ele capacita o dispositivo a resumir áudio gravado, como conversas e entrevistas, bem como propor respostas sugeridas às mensagens.
Ao levar isso adiante, o Google está preparando um cenário para uma competição acirrada no domínio da IA generativa, fornecendo novas ferramentas poderosas em várias plataformas e sinalizando a inovação contínua no setor.