O Google disponibilizou seu modelo de IA mais avançado, Gemini 2.5 Pro (Experimental), disponível para todos os usuários do aplicativo Web Gemini gratuito-substituindo a versão mais antiga e removendo seu paywall anterior. Em vez disso, os usuários notaram a alteração dentro do próprio aplicativo da Gemini Web, onde as respostas agora foram atribuídas ao”Gemini 2.5 Pro (exp)”por padrão para alguns. Os usuários gratuitos agora podem selecionar Gemini 2.5 Pro por meio do seletor de modelos. Essa urgência aponta para uma mudança de estratégia-o Google não está mais restringindo sua IA de primeira linha atrás de um paywall, mas empurrando-o para todos, de graça.
Gemini 2.5 Pro está decolando 🚀🚀🚀
A equipe está correndo, as TPUs estão funcionando quente e queremos colocar nosso modelo mais inteligente nas mãos de mais pessoas o mais rápido possível. href=”https://t.co/eqcjwwvhxj”Target=”_blank”> https://t.co/eqcjwwvhxj
-Google Gemini App (@geminiapp) 29 de março, 2025
Apenas cinco dias antes, em 25 de março, o Gemini 2.5 Pro foi disponibilizado exclusivamente para pagar assinantes de Gemini Advanced e usuários do Google AI Studio. Essa versão foi limitada pela primeira vez ao Plano Premium AI Premium de US $ 19,99/mês. Até o final da semana, a versão experimental desse mesmo modelo se tornou o padrão para todos que usam o aplicativo Gemini, incluindo os do nível gratuito. Ele também reflete a confiança no desempenho do modelo e na prontidão do mundo real, mesmo em uma forma experimental. Diferentemente dos modelos generativos tradicionais que dependem de previsões de passagem única, esse modelo executa verificação lógica em várias etapas para fortalecer seu raciocínio.
Essa grande janela de contexto permite que Gemini processe livros inteiros, contratos legais ou bases de código de uma só vez. Na referência MRCR 128K, que testa a compreensão em conteúdo de formato longo, Gêmeos alcançou 91,5% de precisão e manteve 83,1% de desempenho em grande escala-significativamente à frente do GPT-4.5 de 36.3.3. href=”https://lmarena.ai/?leaderboard”Target=”_ Blank”> atingindo a tabela de classificação LMARENA por quase 40 pontos. Para tarefas multimodais envolvendo texto e imagens, ele obteve 81,7% no benchmark MMMU-novamente à frente de Claude 3,7 sonetos e GPT-4.5.
No entanto, o desempenho varia entre as categorias. Gemini obteve 52,9% no SimpleQA, um teste de recall de factual, atrás de 62,5% do GPT-4.5. Em cenários de engenharia de software autônomos (codificação Agentic), Claude, 3,7 sonetos, ainda lidera com 70,3%, enquanto Gemini trata de 63,8%.
fonte: fonte: Google
Ferramentas de desenvolvedor e recursos multimodais
Enquanto os leads altos do OpenAi O3-Mini na geração de código ao vivo (74,1% no LiveCodeBench), o Gemini 2.5 Pro é o seu próprio a 70,4%. Ele tem um desempenho ainda melhor nas tarefas de edição de código. Na referência de poliglot da AIDER-projetada para testar a modificação multilíngue de código-a Generiini obtém 74,0%, superando os modelos mais recentes de Claude e Deepseek. Esse recurso se estende a ferramentas como o Gemini Live, que permite assistência de tela e câmera. O Google também integrou os Gêmeos em ferramentas de espaço de trabalho como Gmail, Docs e Drive-fornecendo resumos inteligentes, aprimoramentos de pesquisa de email e auxílios de navegação documentar. Ele também está substituindo o Google Assistant como a voz padrão AI em dispositivos Android. A mudança desenhou reações mistas. Alguns usuários elogiaram o desempenho de Gemini em tarefas como codificação e pesquisa.
Outros criticaram a mudança, citando recursos de assistente ausentes e interações de voz menos intuitivas. Gêmeos também está incorporando o histórico de pesquisa para respostas personalizadas-vendo sobreposições futuras entre a IA e a pesquisa tradicional. Se essa estratégia paga dependerá de como os usuários respondem.