TL;DR

L’essentiel : Google serait en train de finaliser”Nano Banana 2 Flash”, nom de code interne”Mayo”, pour une version en décembre afin de contrer ses concurrents chinois à bas prix. Détails clés : La stratégie divise la gamme en un modèle « Mayo » à coût optimisé et une variante Pro « Ketchup » haute fidélité. Pourquoi c’est important : les variantes Flash visent apparemment à garantir l’adoption par les entreprises en offrant des coûts d’inférence inférieurs tout en conservant la précision de suivi des instructions qui est devenue une référence dans l’industrie.

Google finalise « Nano Banana 2 Flash », un successeur à coût optimisé de son puissant modèle d’édition d’images Gemini 3 Pro Image. Nom de code interne « Mayo », le nouveau système vise une version en décembre pour garantir l’adoption par les entreprises face aux concurrents chinois émergents.

Des fuites révèlent une stratégie bifurquée, associant le « Mayo » axé sur l’efficacité à une variante « Pro » haut de gamme nommée « Ketchup ». Cette itération rapide vise à capitaliser sur la marque « Nano Banana », qui est rapidement devenue une norme industrielle en matière de précision du suivi des instructions dans la génération d’images IA.

Noms de code internes et « Flash » Pivot

Cette itération rapide est motivée par un marché qui est passé de la génération pure à une édition précise basée sur des instructions. Selon les rapports sur le modèle à venir, la nouvelle architecture divise la gamme de produits en niveaux distincts.

« Mayo » servirait de modèle d’inférence à grand volume, optimisé pour la vitesse et la rentabilité. Une variante « Pro » distincte, baptisée en interne « Ketchup », ciblera une fidélité maximale pour les flux de travail de production.

BREAKING 🚨 : Google prévoit de publier Nano Banana 2 Flash dans les semaines à venir, alors qu’une nouvelle annonce”Mayo”a été ajoutée au site Web Gemini.

Selon les tests, Nano Banana 2 Flash offre presque la même qualité que Pro à un prix inférieur.

Mayo ou Ketchup ? 🌭 https://t.co/c1HjFnhGlq pic.twitter.com/R1mKyJ2jIA

— Actualités TestingCatalog 🗞 (@testingcatalog) 7 décembre 2025

Représentant une accélération significative dans le cycle de développement de Google, la mise à jour arrive juste deux mois après la sortie de Gemini 2.5 Flash Image, qui a établi la domination de l’entreprise dans le domaine de l’édition.

Promo

Les premiers utilisateurs ont constaté que l’architecture précédente résolvait des problèmes critiques de cohérence spatiale.

Le passage de Google à une variante « Flash » résout spécifiquement les frictions liées à la mise à l’échelle de l’entreprise. Bien que le prix par image du modèle actuel soit compétitif, les applications à grand volume nécessitent des coûts opérationnels inférieurs pour rester viables.

La norme « Banana » : du mème à la référence de l’industrie

À l’origine un nom de code viral sur le classement LMArena, la marque « Nano Banana » a transcendé le marketing de Google pour devenir un terme générique de l’industrie pour le suivi d’instructions de haute précision.

Les concurrents comptent désormais sur cette architecture pour former leurs propres systèmes. Dans le cadre d’un développement notable, les chercheurs ont exploité l’ensemble de données Pico-Banana-400K d’Apple pour construire une base solide pour les futurs modèles d’édition.

Dépensant environ 100 000 $, l’équipe a généré près de 400 000 exemples en utilisant l’infrastructure de Google.

La chronologie de la « Nano Banana »

Comment un nom de code viral est devenu une norme industrielle pour l’édition par l’IA.

S’appuyer sur un La technologie rivale pour la génération de données met en évidence l’écart actuel dans les capacités open source. Le modèle de Google est effectivement devenu la référence en matière de maintien de la cohérence visuelle lors de modifications complexes.

Une telle reconnaissance généralisée valide la stratégie de Google consistant à intégrer ces outils directement dans les applications grand public. En abaissant les barrières à l’entrée, l’entreprise vise à conquérir le marché des créateurs occasionnels aux côtés des professionnels.

Nicole Brichtova, responsable produit chez Google DeepMind, a décrit l’impact de l’accessibilité de ces flux de travail avancés en octobre :

“Nous mettons entre les mains des créateurs de tous les jours des fonctionnalités qui nécessitaient auparavant des outils spécialisés, et cela a été inspirant de voir l’explosion de créativité que cela a déclenchée.”

La guerre des prix et le multimodal. Consolidation

La volonté de Google d’adopter un niveau « Flash » est une réponse directe aux prix agressifs de ses concurrents chinois. Le lancement de Seedream 4.0 par ByteDance a introduit un modèle qui sous-cote Google d’environ 28 %.

L’analyse du marché montre que le géant chinois propose une génération à environ 0,028 $ par image, contre 0,039 $ pour Google. Pour empêcher les entreprises clientes de se tourner vers ces alternatives moins chères, le modèle « Mayo » devra probablement égaler ou battre ce niveau de prix.

Au-delà des prix, le domaine concurrentiel s’oriente vers des flux de travail unifiés de « génération plus édition ». La récente expansion du Studio d’ElevenLabs illustre cette tendance, en fusionnant les modèles vidéo d’OpenAI et de Google dans une seule chronologie.

L’équipe d’ElevenLabs a souligné la valeur stratégique de cette agrégation dans son annonce :

“Unifie les modèles d’IA les plus avancés avec nos outils vocaux, sonores et musicaux de pointe”

En centralisant ces outils, les concurrents remettent en question les flux de travail fragmentés que Google domine actuellement. Cependant, la popularité des modèles « Nano Banana » constitue un solide fossé défensif.

Categories: IT Info