TL;DR
A essência: o Google está supostamente finalizando o ‘Nano Banana 2 Flash’, codinome interno ‘Mayo’, para lançamento em dezembro para combater concorrentes chineses de baixo custo. Detalhes principais: A estratégia divide a linha em um modelo ‘Mayo’ com custo otimizado e uma variante ‘Ketchup’ Pro de alta fidelidade. Por que é importante: as variantes do Flash aparentemente visam garantir a adoção pelas empresas, oferecendo custos de inferência mais baixos e, ao mesmo tempo, mantendo a precisão no seguimento de instruções que se tornou uma referência no setor.
O Google está finalizando o ‘Nano Banana 2 Flash’, um sucessor com custo otimizado de seu poderoso modelo de edição de imagens Gemini 3 Pro Image. Com o codinome interno ‘Mayo’, o novo sistema tem como objetivo ser lançado em dezembro para garantir a adoção pelas empresas contra concorrentes chineses em ascensão.
Documentos vazados revelam uma estratégia bifurcada, combinando o ‘Mayo’, focado na eficiência, com uma variante ‘Pro’ de ponta, codinome ‘Ketchup’. A iteração rápida visa capitalizar a marca ‘Nano Banana’, que rapidamente se tornou um padrão da indústria para precisão no seguimento de instruções na geração de imagens de IA. Pivot
O que impulsiona essa iteração rápida é um mercado que mudou da geração pura para a edição precisa e baseada em instruções. De acordo com relatórios do próximo modelo, a nova arquitetura bifurca a linha de produtos em níveis distintos.
O “Mayo” supostamente servirá como modelo de inferência de alto volume, otimizado para velocidade e eficiência de custos. Uma variante ‘Pro’ separada, chamada internamente de ‘Ketchup’, terá como objetivo a máxima fidelidade para fluxos de trabalho de nível de produção.
*NOVO* Nano Banana Flash alimentado por 3 Flash – exemplos!
Uma nova variante Nano Banana está chegando com o Gemini 3 Flash em vez do 3 Pro!
Provavelmente será mais barato e mais rápido, mas ainda MUITO semelhante ao NB Pro. Aqui estão alguns exemplos de resultados: pic.twitter.com/58oMRegy89
— Leeham (@Liam06972452) 8 de dezembro de 2025
Representando uma aceleração significativa no ciclo de desenvolvimento do Google, a atualização chega apenas dois meses após o Gemini 2.5 Lançamento da imagem Flash, que estabeleceu o domínio da empresa na área de edição.
Promo
Os primeiros usuários descobriram que a arquitetura anterior resolveu problemas críticos de consistência espacial.
A mudança do Google para uma variante ‘Flash’ aborda especificamente o atrito do dimensionamento empresarial. Embora o preço por imagem do modelo atual seja competitivo, aplicações de alto volume exigem custos operacionais mais baixos para permanecerem viáveis.
O padrão ‘Banana’: do meme ao benchmark da indústria
Originalmente um codinome viral no placar de classificação da LMArena, a marca ‘Nano Banana’ transcendeu o marketing do Google para se tornar um termo genérico da indústria para seguir instruções de alta precisão.
Os concorrentes agora contam com nesta arquitetura para treinar seus próprios sistemas. Em um desenvolvimento notável, os pesquisadores aproveitaram o conjunto de dados Pico-Banana-400K da Apple para construir uma base robusta para futuros modelos de edição.
Gastando aproximadamente US$ 100.000, a equipe gerou quase 400.000 exemplos usando a infraestrutura do Google.
A linha do tempo “Nano Banana”
Como um codinome viral se tornou um padrão do setor para edição de IA.
Confiar na tecnologia de um rival para geração de dados destaca a lacuna atual nas capacidades de código aberto. O modelo do Google tornou-se efetivamente o padrão ouro para manter a consistência visual durante edições complexas.
Esse reconhecimento generalizado valida a estratégia do Google de integrar essas ferramentas diretamente em aplicativos de consumo. Ao reduzir a barreira de entrada, a empresa pretende capturar o mercado de criadores casuais ao lado dos profissionais.
Nicole Brichtova, líder de produto do Google DeepMind, descreveu o impacto de tornar esses fluxos de trabalho avançados acessíveis, em outubro:
“Estamos colocando recursos que costumavam exigir ferramentas especializadas nas mãos dos criadores diários, e tem sido inspirador ver a explosão de criatividade que isso desencadeou.”
Guerra de preços e multimodal Consolidação
O impulso do Google para um nível ‘Flash’ é uma resposta direta aos preços agressivos dos rivais chineses. O lançamento do Seedream 4.0 pela ByteDance introduziu um modelo que supera o Google em aproximadamente 28%.
A análise de mercado mostra que a gigante chinesa oferece geração a cerca de US$ 0,028 por imagem, em comparação com os US$ 0,039 do Google. Para evitar que os clientes empresariais optem por estas alternativas mais baratas, o modelo “Mayo” provavelmente terá de igualar ou superar este nível de preço.
Além do preço, o campo competitivo está a mudar para fluxos de trabalho unificados de “geração mais edição”. A recente expansão do Studio da ElevenLabs exemplifica essa tendência, mesclando modelos de vídeo da OpenAI e do Google em uma única linha do tempo.
A equipe da ElevenLabs enfatizou o valor estratégico dessa agregação em seu anúncio:
“Unifica os modelos de IA mais avançados com nossas ferramentas de voz, som e música líderes do setor”
Ao centralizar essas ferramentas, os concorrentes estão desafiando os fluxos de trabalho fragmentados que o Google domina atualmente. No entanto, a grande popularidade dos modelos ‘Nano Banana’ proporciona um forte fosso defensivo.