TL;DR
Istota: według doniesień Google finalizuje prace nad rozwiązaniem „Nano Banana 2 Flash”, o wewnętrznej nazwie kodowej „Mayo”, którego premiera odbędzie się w grudniu, aby stawić czoła taniej chińskiej konkurencji. Kluczowe szczegóły: strategia dzieli linię na zoptymalizowany pod względem kosztów model „Mayo” i wysokiej jakości wariant „Ketchup” Pro. Dlaczego to ma znaczenie: Warianty Flash najwyraźniej mają na celu zapewnienie wdrożenia w przedsiębiorstwach, oferując niższe koszty wnioskowania przy jednoczesnym zachowaniu precyzji wykonywania instrukcji, która stała się punktem odniesienia w branży.
Google finalizuje prace nad „Nano Banana 2 Flash”, zoptymalizowanym pod względem kosztów następcą potężnego modelu do edycji obrazów Gemini 3 Pro Image. Nowy system, nazwany wewnętrznie „Mayo”, ma zostać wydany w grudniu, aby zabezpieczyć przyjęcie przez przedsiębiorstwa przed rosnącą chińską konkurencją.
Wycieki ujawniają rozwidloną strategię, łączącą skoncentrowany na wydajności „Mayo” z wysokiej klasy wariantem „Pro” o nazwie kodowej „Ketchup”. Celem tej szybkiej iteracji jest wykorzystanie marki „Nano Banana”, która szybko stała się branżowym standardem w zakresie precyzji wykonywania instrukcji w generowaniu obrazów AI.
Wewnętrzne nazwy kodowe i „Flash” Pivot
Realizacja tej szybkiej iteracji to rynek, który przeszedł od czystej generacji do precyzyjnej edycji opartej na instrukcjach. Według raportów na temat nadchodzącego modelu nowa architektura dzieli linię produktów na odrębne poziomy.
„Mayo” według doniesień będzie służyć jako model wnioskowania o dużej objętości, zoptymalizowany pod kątem szybkości i efektywności kosztowej. Oddzielny wariant „Pro”, wewnętrznie nazwany „Ketchup”, będzie miał na celu maksymalną wierność przepływów pracy na poziomie produkcyjnym.
ŁAMANIE 🚨: Google planuje wypuścić Nano Banana 2 Flash w nadchodzących tygodniach, po dodaniu nowego ogłoszenia „Mayo” do sieci Gemini.
Według testów Nano Banana 2 Flash zapewnia prawie taką samą jakość jak Pro, ale za niższą cenę.
Majonez czy Ketchup? 🌭 https://t.co/c1HjFnhGlq pic.twitter.com/R1mKyJ2jIA
— Wiadomości z katalogu testowego 🗞 (@testingcatalog) 7 grudnia 2025 r.
Aktualizacja stanowi znaczące przyspieszenie w cyklu rozwoju Google dwa miesiące po wydaniu Gemini 2.5 Flash Image, co ugruntowało dominację firmy na arenie montażowej.
Promo
Wcześni użytkownicy odkryli, że poprzednia architektura rozwiązała krytyczne problemy związane ze spójnością przestrzenną.
Przejście Google na wersję „Flash” w szczególności rozwiązuje problemy związane ze skalowaniem przedsiębiorstwa. Chociaż cena obecnego modelu za obraz jest konkurencyjna, aplikacje masowe wymagają niższych kosztów operacyjnych, aby zachować rentowność.
Standard „Banan”: od memu do wzorca branżowego
Oryginalnie wirusowy kryptonim na tablicy liderów LMArena, marka „Nano Banana” przekroczyła marketing Google i stała się ogólnym terminem branżowym oznaczającym bardzo precyzyjne przestrzeganie instrukcji.
Konkurenci polegają obecnie na tej architekturze przy szkoleniu własnych systemów. Dokonując godnego uwagi projektu, badacze wykorzystali zbiór danych Apple Pico-Banana-400K do zbudowania solidnych podstaw pod przyszłe modele edycji.
Wydając około 100 000 dolarów, zespół wygenerował prawie 400 000 przykładów, korzystając z infrastruktury Google.
Oś czasu „Nano Banana”
Jak wirusowy kryptonim stał się standardem branżowym w zakresie edycji sztucznej inteligencji.
Poleganie na technologii konkurencyjnej w zakresie generowania danych uwypukla obecną lukę w możliwościach oprogramowania typu open source. Model Google skutecznie stał się złotym standardem zachowania spójności wizualnej podczas złożonych edycji.
Tak szerokie uznanie potwierdza strategię Google polegającą na bezpośredniej integracji tych narzędzi z aplikacjami konsumenckimi. Obniżając barierę wejścia, firma zamierza zdobyć rynek twórców okazjonalnych wraz z profesjonalistami.
Nicole Brichtova, liderka produktu w Google DeepMind, w październiku opisała wpływ udostępnienia tych zaawansowanych przepływów pracy:
„Oddajemy w ręce twórców codziennych funkcje, które wcześniej wymagały specjalistycznych narzędzi, i obserwowanie eksplozji kreatywności, która to wywołała, było inspirujące.”
Wojny cenowe i Konsolidacja multimodalna
Nacisk Google na poziom „Flash” jest bezpośrednią odpowiedzią na agresywne ceny chińskich rywali. Wprowadzenie Seedream 4.0 przez firmę ByteDance wprowadziło model, który podcina Google o około 28 procent.
Analiza rynku pokazuje, że chiński gigant oferuje generowanie obrazu po cenie około 0,028 USD za obraz w porównaniu do 0,039 USD Google. Aby uniemożliwić klientom korporacyjnym przejście na tańsze alternatywy, model „Mayo” będzie prawdopodobnie musiał dorównać lub przewyższyć tę granicę cenową.
Poza ceną pole konkurencji przesuwa się w stronę ujednoliconych przepływów pracy „generowanie i edycja”. Niedawna ekspansja Studio ElevenLabs jest przykładem tego trendu, łącząc modele wideo z OpenAI i Google w jedną oś czasu.
Zespół ElevenLabs w swoim ogłoszeniu podkreślił strategiczną wartość tej agregacji:
„Ujednolica najbardziej zaawansowane modele sztucznej inteligencji z naszymi wiodącymi w branży narzędziami do obsługi głosu, dźwięku i muzyki”
Poprzez centralizację tych narzędzi konkurenci rzucają wyzwanie fragmentarycznym przepływom pracy, nad którymi obecnie dominuje Google. Jednak sama popularność modeli „Nano Banana” stanowi silną fosę obronną.