Google 發布了 Veo 3.1,這是對其 AI 視頻生成模型的重大更新,可增強創作者的創意控制和真實感。新版本正在向 Google 的 AI 電影製作工具 Flow 推出,引入更精細的編輯功能。

用戶現在可以將對象添加到場景中,並受益於 Flow 的所有高級功能中更豐富、同步的音頻。該更新還提高了即時依從性和視覺質量,可通過 Flow 編輯器、Gemini 應用以及面向開發者的 Gemini API

此舉表明 Google 打算使其生成工具更加強大和直觀。自 5 月份 Flow 推出以來,用戶已創作了超過 2.75 億個視頻,這表明對無障礙 AI 視頻創作的強烈需求。該版本被視為針對 OpenAI 的 Sora 2 的直接競爭舉措。

Flow 中提供更精細的創意控制

在其公告中,Google 將此次更新視為對創作者的直接回應 更複雜的後期生成工具的反饋。

產品負責人 Jess Gallegos 和 Thomas Iljic 表示,“我們一直在傾聽您的反饋,我們聽說您希望在 Flow 中進行更多的藝術控制,並在所有功能中增加對音頻的支持。”

這種對用戶驅動迭代的關注標誌著戰略轉變,將 Flow 從純粹的生成引擎轉變為更全面的交互式創意引擎

這項工作的核心是 Flow 編輯器中的一套新編輯工具,專為第一次拍攝不是最終拍攝的時刻而設計。

[嵌入內容]

最值得注意的新增功能是“插入”功能,它使創作者能夠將新元素(從微妙、現實的細節到完全奇幻的生物)添加到已生成的視頻剪輯中。

它的設計目的是讓用戶能夠直接在應用程序中重新構想和完善場景,從而減少對外部編輯軟件進行細微調整和添加的需求。

根據 Google 的說法,該模型的複雜性可確保這些添加內容顯得自然且適合上下文。 Veo 3.1 智能分析現有場景,以處理陰影和環境照明等複雜細節,確保新對象紮根於環境中。

此外,該模型還致力於將插入的元素融入剪輯既定的藝術風格中。此功能超越了簡單的對象放置,提供了一種更加動態和有凝聚力的方式來完善人工智能生成的內容。

為了補充這一新功能,Google 還宣布 Flow 編輯器“即將推出”相應的“刪除”功能。

它將允許用戶無縫地從場景中刪除不需要的對像或角色。該公司解釋說,Flow 將自動重建背景和周圍環境,使其看起來好像對像從未存在過。

這些功能共同代表著為 AI 視頻提供完整的內繪畫和外繪畫工具包邁出的重要一步。

從無聲剪輯到豐富的音頻故事講述

Veo 3.1 版本的一個主要焦點是音頻的擴展 能力。 Veo 3 是第一個集成聲音的 Google 模型,該更新建立在 Veo 3 的基礎上,現在將音頻生成引入 Flow 最先進的創意功能中。

此增強功能解決了早期 AI 視頻工具的一個關鍵限制。正如穀歌 DeepMind 首席執行官 Demis Hassabis 此前宣稱的那樣,“我們正在擺脫視頻生成的無聲時代。”此次更新是實現這一願景的重要一步,添加了對話、音效和環境噪音。

它對現實主義的關注對於製作可信且引人入勝的內容至關重要,而無需進行大量的後期製作工作。

創作者現在可以在使用“視頻成分”等功能時生成豐富、同步的音頻,該功能使用參考圖像來控制角色和風格。用於在兩個圖像之間創建過渡的“幀到視頻”工具現在還包括音頻。

[嵌入內容]

用於創建更長、連續鏡頭的“擴展”功能現在還將生成伴隨的音景,使其對於建立鏡頭和更長的敘事序列更有用。

人工智能視頻競賽中的戰略部署

Google 正在其整個人工智能產品套件中部署 Veo 3.1,以最大限度地擴大其影響範圍。除了面向消費者的 Flow 編輯器和 Gemini 應用之外,該模型現在還可供開發者和企業客戶使用。

開發者可以通過Gemini API 中的付費預覽版訪問 Veo 3.1 及其新功能,從而能夠集成 將強大的視頻生成功能融入到自己的應用程序中。企業客戶可以通過 Vertex AI 利用該模型。

這種多管齊下的分銷策略表明了 Google 在快速發展的 AI 領域展開競爭的雄心 視頻。此次發布是在 OpenAI 的 Sora 2 應用程序推出備受爭議之後不久發布的,該應用程序立即面臨著版權和 Deepfake 問題的強烈反對。

相比之下,谷歌繼續強調其對負責任的人工智能的承諾,在所有生成的內容中嵌入其 SynthID 水印。這一戰略似乎旨在將 Veo 定位為更穩定、更適合企業的替代方案。

此次更新還強化了 Google 明確的兩層訂閱戰略,為其 AI Pro 和 AI Ultra 計劃增加了切實價值,以鼓勵採用並建立忠實的用戶群。

塑造 AI 電影製作的未來

生成視頻工具的快速發展 預計將改變創意產業。 Veo 3.1 中引入的細粒度編輯控件和集成音頻降低了高質量視頻製作的技術障礙,使故事講述者能夠更快地迭代想法。

隨著這些平台的成熟,它們不再是新鮮事物,而是從故事板到最終製作的創意工作流程中不可或缺的一部分。重點正在從簡單的文本到視頻輸出轉向人類創造者和人工智能模型之間更具互動性和協作性的過程。

Categories: IT Info