Google今天使用新的圖像到視頻功能增強了其VEO 3 AI模型,使用戶可以將一張照片轉換為帶有聲音的八秒視頻剪輯。現在,該功能正在向公司的AI Pro和AI Ultra的訂閱者推出,並通過Gemini App計劃。
用戶現在可以上傳靜態圖像,並使用描述性文本提示,將其動畫為簡短的動態視頻。此更新是Google報告的《 VEO 3》(WEO 3)令人印象深刻的早期採用,用戶在短短七個星期內創建了超過4000萬個視頻。
此舉是Google策略的關鍵部分,即為其最近簡化的訂閱層增添明顯的價值。它遵循上週VEO 3的文本對視頻功能的全球推出,鞏固了使高級生成型AI工具作為每日資源的推動。
圖片
核心技術VEO 3代表了一個重要的技術飛躍。它產生同步音頻的能力,包括對話和環境效果,是一個關鍵的區別。 Google DeepMind首席執行官Demis Hassabis宣稱,通過這種模型,“我們正在淡出視頻的沉默時代。 ”
這解決了使AI生成的視頻在開箱即用的情況下使AI生成的視頻感到完整的一個重大障礙。 Google DeepMind VP Eli Collins強調了該模型的複雜性,並指出:“ VEO 3從文本和圖像提示到現實世界的物理學和準確的唇部同步。 “對物理和唇部同步的關注對於可信的內容至關重要。
新的圖像到視頻工作流程是為簡單而設計的。在Gemini應用程序中,用戶選擇“視頻”選項,上傳照片,然後為所需的動畫和隨附的音頻效果提供文本說明。
也可以在 [embedded content]
Watermarks and a Commitment to Safety
In a direct response to industry-wide concerns about deepfakes and misinformation, Google is embedding its SynthID watermarking technology into all Veo 3 outputs.對於所有用戶而言,這是生成過程中不可談判的一部分。
每個生成的視頻都包含兩個識別層:可見的“ veo”水印,可立即識別,而隱形的合成數字簽名旨在可靠地進行穩固的諸如裁剪或壓縮或壓縮的常見修改。該公司旨在提供透明度並確保可以清楚地識別AI生成的內容,這是這些工具變得更強大的關鍵步驟。
,但是,解決方案並不是萬無一失的。馬里蘭大學的一項獨立研究發現,水印可能容易受到操縱的影響。研究人員得出結論:“水印為透明度努力提供了價值,但它們並未為AI生成的內容操縱提供絕對的安全性,”
此功能推出強調了Google的改進的AI貨幣化策略,該策略在5月份澄清了這一策略,通過將混亂的品牌名稱退休,例如“ Gemini Advanced”和“ AI Premium”。大修旨在消除長期以來的品牌混亂並創造出更清晰的價值主張。 $ 19.99/月AI Pro計劃定位為主流產品。它為用戶提供了2 TB的存儲,Gemini 2.5 Pro模型和1,000個月度AI積分,Google說,這為“有足夠的創造性探索空間”提供了。 在Stark對比中,$ 249.99/月AI Ultra Ultra Plan目標目標是“高貨量創建者和小型工作室”。它捆綁了30 TB的存儲空間,YouTube高級訂閱以及大量使用的每月12,500個學分。這是合理的,可以及早訪問Mariner AI代理項目等實驗工具。 該策略還涉及Pro用戶的重要樞軸。轉移到每天三代免費的三代免費的轉移是從有限的一次性試驗轉變,將計劃轉變為持續的創意資源,而不是簡單的演示。