Google Todayは、新しい画像からビデオへの新しい画像機能を備えたVEO 3 AIモデルを強化し、ユーザーが1つの写真をサウンドの8秒のビデオクリップに変換できるようにしました。この機能は、Geminiアプリを介して会社のAI ProおよびAI Ultra計画のサブスクライバーに展開されています。
ユーザーは静的画像をアップロードし、説明的なテキストプロンプトを使用して、短いダイナミックなビデオにアニメーション化できるようになりました。この更新は、GoogleがVEO 3の印象的な早期採用を報告しているため、ユーザーはわずか7週間で4,000万件以上のビデオを作成しています。
この動きは、最近簡素化されたサブスクリプション層に有形の価値を追加するGoogleの戦略の重要な部分です。先週VEO 3のテキストからビデオへの機能のグローバル発売に続き、高度な生成AIツールを毎日のリソースにするためのプッシュを固めています。動く画像
コアテクノロジーVeo 3は、重要な技術的飛躍を表しています。ダイアログや周囲の効果を含む同期オーディオを生成する能力は、重要な差別化要因です。 Google Deepmind CEOのDemis Hassabisは、このモデルで「ビデオ生成の静かな時代から出現している」と宣言しました。 Google Deepmind VPのEli Collinsは、モデルの洗練度を強調し、「VEO 3は、実世界の物理学と正確なリップシンクにテキストと画像のプロンプトから優れている」と述べました。物理学と唇のシンクに焦点を当てていることは、信じられるコンテンツにとって重要です。
新しい画像からビデオへのワークフローは、シンプルに設計されています。 Geminiアプリ内で、ユーザーは「ビデオ」オプションを選択し、写真をアップロードしてから、目的のアニメーションと付随するオーディオエフェクトのテキスト指示を提供します。 Flowはビデオ用のVEO、画像資産のイメージ、および自然言語のプロンプトのGeminiを統合し、高度なクリエイティブプロジェクトの包括的なスイートを作成します。出力。これは、すべてのユーザーの生成プロセスの交渉不可能な部分です。
生成されたすべてのビデオには、即時認識のための可視的な「Veo」ウォーターマークと、作物や圧縮などの一般的な変更に対して堅牢になるように設計された目に見えないシンセドデジタル署名が含まれています。同社は、透明性を提供し、AIに生成されたコンテンツを明確に識別できるようにすることを目指しています。これらのツールがより強力になるにつれて重要なステップです。
しかし、ソリューションは絶対確実ではありません。メリーランド大学の独立した研究では、透かしは操作に対して脆弱である可能性があることがわかりました。研究者は、「透明性の取り組みに透明な努力を提供するが、AIに生成されたコンテンツ操作に対する絶対的なセキュリティを提供しない」と結論付けた。より明確なサブスクリプション戦略
この機能は、Googleの改良されたAI収益化戦略を強調しています。これは、「Gemini Advanced」や「AI Premium」などの混乱したブランド名を廃止することで5月に明確にしました。オーバーホールは、長年のブランドの混乱を終わらせ、より明確な価値提案を作成するように設計されました。 2 TBのストレージ、Gemini 2.5 Proモデル、および1,000の月間AIクレジットをユーザーに提供します。これは、Googleが「創造的な探索のための十分なスペース」を提供していると述べています。 30 TBのストレージ、YouTubeプレミアムサブスクリプション、および集中的な使用のための月間12,500の大規模なクレジットをバンドルします。これは、プロジェクトMariner AIエージェントのような実験ツールへの早期アクセスで正当化されます。
戦略には、Proユーザーにとって重要なピボットも含まれていました。 3つの無料のVEO 3世代への移動は、限られた1回限りの試行からのシフトであり、計画を単純なデモではなく持続的な創造的なリソースに変えました。