TL;DR

要點:據報導,谷歌正在敲定“Nano Banana 2 Flash”,內部代號為“Mayo”,將於 12 月發布,以對抗低成本的中國競爭對手。關鍵細節:該策略將產品線分為成本優化的“Mayo”型號和高保真“Ketchup”Pro 型號。重要性:Flash 變體似乎旨在通過提供較低的推理成本來確保企業採用,同時保持已成為行業基準的指令遵循精度。

Google 正在最終確定“Nano Banana 2 Flash”,這是其強大的圖像編輯模型 Gemini 3 Pro Image 的成本優化後繼產品。新系統的內部代號為“Mayo”,目標是在 12 月發布,以確保企業採用,以對抗不斷崛起的中國競爭對手。

洩密事件揭示了一種分叉的策略,將注重效率的“Mayo”與代號為“Ketchup”的高端“Pro”變體配對。快速迭代旨在利用“Nano Banana”品牌,該品牌已迅速成為人工智能圖像生成中指令遵循精度的行業標準。

內部代號和“Flash”樞軸

推動這種快速迭代的是一個市場,它已經從純粹的生成轉向精確的、基於指令的編輯。根據即將推出的模型的報告,新架構將產品線分為不同的層。

據報導,“Mayo”將作為大容量推理模型,針對速度和成本效率進行了優化。一個單獨的“Pro”變體,內部被稱為“Ketchup”,目標是生產級工作流程的最大保真度。

突發🚨:Google 計劃在未來幾週內發布 Nano Banana 2 Flash,因為 Gemini 網絡上添加了新的“Mayo”公告。

根據測試,Nano Banana 2 Flash 的品質與 Pro 幾乎相同,但價格卻更低。蛋黃醬還是番茄醬? 🌭 https://t.co/c1HjFnhGlq pic.twitter.com/R1mKyJ2jIA

—TestingCatalog 新聞 🗞 (@testingcatalog) 2025 年 12 月 7 日

此次更新僅在 Gemini 發布兩個月後發布,代表著 Google 開發週期的顯著加速2.5 Flash Image 版本,確立了公司在編輯領域的主導地位。

Promo

早期採用者發現以前的架構解決了空間一致性方面的關鍵問題。

Google 轉向“Flash”變體專門解決了企業擴展的摩擦。雖然當前模型的每張圖像定價具有競爭力,但大批量應用需要較低的運營成本才能保持可行性。

“香蕉”標準:從 Meme 到行業基準

“Nano Banana”品牌最初是 LMArena 排行榜上的病毒代號,現已超越 Google 的營銷,成為高精度指令跟踪的通用行業術語。

競爭對手現在依靠這個架構來訓練自己的系統。一項值得注意的進展是,研究人員利用 Apple 的 Pico-Banana-400K 數據集為未來的編輯模型奠定了堅實的基礎。

團隊花費約 100,000 美元,使用 Google 的基礎設施生成了近 400,000 個示例。

“Nano Banana”時間線

病毒式代號如何成為 AI 編輯的行業標準。

依賴對競爭對手數據生成技術的研究凸顯了當前開源能力的差距。 Google 的模型實際上已成為在復雜編輯過程中保持視覺一致性的黃金標準。

如此廣泛的認可驗證了 Google 將這些工具直接集成到消費者應用程序中的策略。通過降低准入門檻,該公司的目標是與專業人士一起佔領休閒創作者市場。

Google DeepMind 產品負責人 Nicole Brichtova 在 10 月份描述了使這些高級工作流程變得易於使用所帶來的影響:

“我們正在將過去需要專門工具才能實現的功能交給日常創作者,看到這引發的創造力爆炸令人鼓舞。”

價格戰和多式聯運

Google 推出“Flash”層是對中國競爭對手激進定價的直接回應。字節跳動推出的 Seedream 4.0 引入了一種比 Google 價格低約 28% 的模型。

市場分析顯示,這家中國巨頭提供的每張圖片的價格約為 0.028 美元,而 Google 的價格為 0.039 美元。為了防止企業客戶轉向這些更便宜的替代品,“梅奧”模型可能需要匹配或擊敗這個價格點。

除了定價之外,競爭領域正在轉向統一的“生成加編輯”工作流程。 ElevenLabs 最近的 Studio 擴展體現了這一趨勢,將 OpenAI 和 Google 的視頻模型合併到一個時間線中。

ElevenLabs 團隊在其公告中強調了這種聚合的戰略價值:

“將最先進的 AI 模型與我們行業領先的語音、聲音和音樂工具相結合”

通過集中這些工具,競爭對手正在挑戰 Google 目前主導的碎片化工作流程。然而,“納米香蕉”模型的廣泛流行提供了強大的防禦護城河。

Categories: IT Info