Google已將其最先進的AI視頻生成器VEO 3發布給開發人員,並通過Gemini API和Vertex AI發布了付費預覽。此舉以每秒同步音頻為0.75美元的價格為720p視頻,是Google企業貨幣化的重要一步。
這使開發人員可以將模型集成到高定義視頻,對話,對話和單個提示中的聲音效果,直接將其集成到他們自己的應用程序中。 API發布遵循了一系列快速的更新,這些更新最近帶來了圖像到視頻功能,並全球訪問了Google AI訂閱者。
從消費者應用到開發人員api
target=“ _ blank”>新開發人員訪問對於迄今為止,它主要是面向消費者的功能的模型的關鍵擴展。 API當前支持文本到視頻生成,Google承諾將圖像到視頻功能正在途中。未來的API發行版也計劃更快,更具成本效益的“ veo 3快速”模式。 Google DeepMind VP Eli Collins指出:“ VEO 3從文本和圖像中脫穎而出,促使現實世界的物理和準確的唇部同步。”這種能力是最初揭示的關鍵部分,首席執行官Demis Hassabis宣稱,通過這項技術,“我們正在陷入視頻生成時代的寂靜時代。”
為了幫助開發人員開始,Google為SDK模板和 Google AI Studio中的快速原型。這可以進行快速實驗,然後再進行全尺度整合,這是基於用法的成本。
早期實驗:從3D動畫到遊戲Cinematics
,以證明API的實用價值超過了簡單的技術,Google越來越高點,Google享有早期的Demaps,它是如何使用veo
For instance, animation company Cartwheel has developed a system that translates 2D video of human movement into production-ready 3D animation.該公司使用VEO 3來生成真實而流動的人類行動,該行動是其管道的基礎數據,將AI輸出變成了為客戶的操縱角色動畫。
同樣,生產遊戲中的視頻過場動畫這在其即將到來的RPG中推進了故事,該故事以Wit的結局。這使其設計師可以快速嘗試新的敘事思想和視覺效果,這是遊戲開發的迭代循環中的關鍵優勢。
這些精心挑選的用例非常專業,這可能表明,更大,更主流的集成尚未準備好發佈公告。這是推出強大但昂貴的新技術的常見策略,首先關注可以立即吸收成本的利基行業。
定價結構強調了這一專業重點。根據 Google的官方費用,一個八秒鐘的剪輯的價格為6美元,而五分鐘的視頻將運行225美元。由於產生完美的結果通常需要進行多次嘗試,因此現實世界的成本可能會迅速升級。
正如一個分析所指出的那樣,創建五分鐘的可用鏡頭可能需要產生十倍的數量,並可能將總成本推向2,250美元。 Google敢打賭,對於某些用例,這仍然比傳統的視頻製作方法便宜得多。
[嵌入式內容]
更廣泛的AI策略
這個API的最終部分是該API的發射是在veo 3中脫穎而出的一個月,將其轉變為多個新模型,將其轉變為多個新模型。開發人員訪問在7月初向AI Pro訂戶發布了該模型的全球發行,並在上週增加了圖像到視頻功能。
此舉鞏固了VEO 3作為Google澄清的兩層AI訂閱策略的中央支柱的位置。這種結構在主流$ 19.99/月的AI Pro計劃中創造了一個明顯的區別,旨在一般的創意探索,高端$ 249.99/月AI的專業人士AI超級計劃。
Google Labs vp Josh Woodward先前以前以前將優質經驗定為專有的經驗,您可以將其視為“您可以將其視為Ultra Plans for the Ulta Plans for the Ultra Plans”。 API現在提供了訪問該技術的第三條截然不同的途徑,這是針對商業整合而不是個人用途的第三條途徑。
此發布的位置使Google在關鍵競賽中與OpenAI等競爭對手更直接競爭,以向開發人員和企業提供基礎AI模型。通過在其最先進的視頻模型上貼上價格標籤,Google對生成AI市場的商業野心做出了清晰的陳述。
解決了對濫用和深擊的不可避免的擔憂,所有通過API生成的視頻都將包括數字合成的WaterMark。這是Google對負責AI開發的承諾的核心部分,並為AI生成的媒體提供了透明度。但是,這項技術不是銀彈,因為學術研究注意到水印不是一個有道德的。作為電影製片人Darren Aronofsky 現在,這些工具是 現在對於講故事的未來。 ”