O Google lançou oficialmente a imagem flash Gemini 2.5, o poderoso modelo de IA que se tornou viral em agosto como”nano banana”, tornando-o geralmente disponível para desenvolvedores e empresas em todo o mundo.
Anunciado em 2 de outubro, a ferramenta Patration-Reading agora é acessível através da API Gemini, o Google Ai Studio e o vertex ai. proporções e consistência aprimorada do caractere para edições mais realistas. Geração nas mãos de mais criadores.
A liberação geral de disponibilidade em 2 de outubro também é significativa de atualizações focadas na produção. Isso permite que os criadores adaptem o conteúdo de plataformas específicas.
A atualização também refina a força central do modelo:”Consistência do personagem”. Esse recurso, que preserva a semelhança de um sujeito nas principais edições, aborda um ponto de falha comum para muitos modelos de IA. para processar texto e imagens simultaneamente. Isso significa que ele pode entender uma imagem existente e incorporá-la ao seu processo criativo, em vez de apenas gerar a partir de um prompt de texto.
Isso permite edições mais precisas e consistentes sobre uma conversa. A IA Startup Cartwheel achou o modelo capaz de lidar com o complexo de qualquer ângulo da câmera. US $ 0,039 por imagem e US $ 30 por milhão de tokens de produção, uma taxa competitiva destinada a impulsionar a adoção da empresa por meio de sua plataforma Ai Vertex. A pressão se intensificou após o OpenAI integrar seu gerador de imagens GPT-4O diretamente no ChatGPT, impulsionando um aumento enorme no envolvimento do usuário. A Bytedance lançou seu modelo SeedReam 4.0 como um desafiante direto para”nano banana”.
Equilibrando o poder criativo com novas salvaguardas
O empurrão do Google ocorre após tropeços anteriores na geração de imagens da IA. Este novo lançamento é acompanhado por protocolos de segurança mais robustos. Isso contrasta com as batalhas legais que envolvem concorrentes como Midjourney. Editando ferramentas em seu principal produto de IA, o Google está posicionando Gemini não apenas como um chatbot, mas cada vez mais como um mecanismo criativo abrangente, semelhante ao OpenAI, que acabou de lançar seu modelo de vídeo SORA 2 AI.
O movimento é uma aposta clara de que a acessibilidade e a confiança podem conquistar usuários convencionais no campo em rápida evolução da IA generativa.