Google已正式推出了Gemini 2.5 Flash Image,這是一種強大的AI模型,在八月以“ Nano Banana”的病毒式傳播,使其通常可用於全球開發人員和企業。

10月2日宣布的生產已準備就緒的工具現在可以通過Gemini Api,Google AI Studio和Vertecober windusio profestion workettor wistrio prounder ofertione procription in oferty procrizity procruction in of vertex ai pround ofertion。寬高比和增強的性格一致性。

新的創造性控制和早期採用者成功

該模型首次在眾包評估平台lmarena上匿名出現在眾包評估平台lmarena上,即“納米-班納納”(Nano-Banana),迅速成為世界上最高的圖像編輯模型。

10月2日的一般可用性發布也大量以生產為中心的升級。

一個關鍵增強是對10種不同長寬比的支持,從電影景觀到垂直社交媒體格式。這使創建者可以為特定平台定制內容。

更新還完善了模型的核心強度:“角色一致性”。 This feature, which preserves a subject’s likeness across major edits, addresses a common failure point for many AI models.

Nicole Brichtova, a product lead at Google DeepMind, noted, “we’re putting capabilities that used to require specialized tools into the hands of everyday creators, and it’s been inspiring to see the explosion of creativity this has sparked.”

The model’s native multimodal capability allows它可以同時處理文本和圖像。這意味著它可以理解現有圖像並將其納入其創作過程,而不僅僅是從文本提示中生成。

這可以在對話中更精確,更一致地編輯。

早期採用者已經整合了這些功能。 AI啟動Cartwheel發現了從任何相機角度處理複雜姿勢的模型。

聯合創始人安德魯·卡爾(Andrew Carr)讚揚了Google,他說:“其他型號無法從任意攝像機角度呈現字符,或者從任意相機角度或保持姿勢的忠誠度或對姿勢保持姿勢,而無需犧牲“世界知識”。圖像和每百萬美元的產出代幣,旨在通過其頂點AI平台推動企業採用的競爭率。

在擁擠的AI Image Race

中,計算出的動作

發射是對競爭激烈的市場的計算響應。 OpenAI在將其GPT-4O圖像發生器直接集成到CHATGPT之後加劇的壓力,推動了用戶參與度的巨大激增。

Google的策略直接在其聊天應用程序中以廣泛的訪問為目標。 ByteDance has launched its Seedream 4.0 model as a direct challenger to “Nano Banana”.

Meta has also pivoted its strategy for AI image generation, opting to license technology from Midjourney after internal setbacks.

The market is has been seeing specialized players emerge, like Black Forest Labs focusing on photorealism and Alibaba’s model excelling at text rendering.

在AI Image生成中以前的偶然發現之後,將創造力與新的保障措施之間的平衡

當Gemini的早期版本產生的早期版本在歷史上產生了歷史上不准確的圖像時,該公司面臨反對,迫使該功能的臨時懸掛。這個新的發布伴隨著更強大的安全協議。

為了解決深層攝影的威脅,Google正在水印上所有生成的內容。

圖像將包括可見的標記和隱形的,隱形的合成水印,以清楚地表明它們是AI生成的。這與Midjourney等法律鬥爭形成鮮明對比。

MidJourney目前正面臨迪士尼和環球公司對培訓數據的備受矚目的版權訴訟。

,它強調了所有ai comporation ai納入谷歌,使谷歌構成了良好的策略,

。 Google在其旗艦AI產品中編輯工具不僅將Gemini定位為聊天機器人,而且越來越多地像Openai一樣,越來越多地將其作為綜合的創意引擎,該引擎剛剛啟動了Sora 2 AI視頻模型。

這一舉動很明顯,可訪問性和信任可以贏得生成AI的快速發展領域的主流用戶。

Categories: IT Info