Googleは、AIを搭載したビデオジェネレーターVeo 2をGemini Advancedユーザーに拡張し、プラットフォームのWebおよびモバイルインターフェイスから直接テキストベースのビデオ作成を可能にしました。 19.99ドル/月のAIプレミアムプランの加入者は、VEO 2を使用して、書面によるプロンプトに基づいて8秒の720pビデオクリップを生成できるようになりました。この動きは、エンタープライズレベルの実験から消費者向けの創造性への移行を示しており、非専門家がAIビデオ制作ツールに簡単に取り組むことが容易になります。
Googleは、泡立てのアニメーション画像からビデオへのアニメーション画像ツールも導入し、ユーザーがVeoのバックエンドを使用して短いビデオシーケンスに静的な画像をアニメーション化できるようにします。 Google Labsを介してアクセス可能なこのツールは、Gemini AdvancedのVEO 2へのVEO 2へのアクセスを、Google AI Studioを介した以前のプレビューローンチに続いて、趣味のワークフローと視覚デザイナーの両方を開きます。それ以前は、開発者とエンタープライズチームはVEO 2を使用してVertex AIを使用していました。このコストは、レンダリングされたコンテンツの秒あたり0.50ドルでした。 Gemini Advancedへのロールアウトは、4月9日に次の2025年の発表と4月11日に開発者アクセスを行い、マルチ層の打ち上げ戦略を完了します。リアリズム
よりシンプルな迅速なビデオツールとは異なり、VEO 2はユーザーが映画の特性に影響を与えることができます。 「浅い被写界深度で被写体を追跡する」や「広角レンズの使用」などの指示は、最終出力に理解され、反映されます。 Googleによれば、モデルは「映画撮影の言語」でトレーニングされており、消費者AIビデオプラットフォームでは通常見られないショット固有のスタイルコントロールが可能になります。
モデルの視覚エンジンは、2024年12月に最初に示された機能に基づいて構築されます。初期のデモで取り上げられているこれらの例は、ほとんどの生成的なビデオシステムに挑戦するエリアである、照明行動、自然な動き、テクスチャーの忠実度を複製するVEO 2の能力を示しました。 Gemini Advancedは、生成を短く低解像度の出力に制限しますが、基礎エンジンは同じままです。
内部テストは、「ユーザーの59%がSORA TurboよりもVeo 2の出力を好む」ことを示しました。これにより、VEOは視覚品質の競争力を得ますが、アクセス層の制限は依然として非エンテルプライズユーザーの完全なパフォーマンスを制限します。ショートパンツのクリエイターは、自然言語を使用して、視覚的なスタイルをAIに生成されたクリップに適用できます。
これらのツールは、同じVEO 2インフラストラクチャに依存していますが、UIレイヤーとアクセスモデルが異なります。 Gemini Advancedはバンドルされたアクセスを提供しますが、YouTubeとLabsはGoogleの既存のクリエイティブエコシステム全体に生成AIを埋め込むという戦略を反映しています。 Geminiユーザーはフラットな毎月のサブスクリプションを支払い、キャップの数の世代を受け取ります。Googleは、ユーザーが「毎月の世代の制限にアプローチするときに通知される」 トレーニングデータに関するGoogleの位置はあいまいです。 YouTubeのクリエイターはサードパーティモデルトレーニングをオプトアウトできますが、同社は独自のAIにパブリックコンテンツを使用する権利を保持しています。 YouTubeポリシーは、「不正なスクレイピングなど、不正な方法で作成者コンテンツにアクセスすることは禁止されたままだ」と述べていますが、批評家は、これは不本意なモデルの貢献に関する懸念に完全に対処していないことに注意しています。それまでは、Veoの能力の構築におけるYouTubeデータの役割についての推測が続きます。 For example, the model was used to help enhance The Wizard of Oz for the immersive LED dome at the Las Vegas球体、元の映像とAI-Extendedの背景を組み合わせます。このアプリケーションは、プロの設定でのデジタル修復とスケーラブルなコンテンツの増強をサポートするVEOの可能性を強調しています。 戦略レベルでは、GoogleはVEO 2を画像生成用のイメージン、音楽のLyria、およびスピーチのChirpを含むより広範なAIツールキットの一部と見なしています。これらのモデルは、クロスメディアコンテンツの作成をサポートするために、頂点AIおよびGoogle Labsにますます統合されています。 Deepmind CEOのDemis Hassabisは最近、「Googleは最終的にGeminiとVeo AIモデルを組み合わせて物理的世界の理解を高める」と述べました。今のところ、Veo 2がGemini Advancedの到着には、より即時の野心を示しています。非専門家にカメラ、乗組員、または高価な編集ソフトウェアを必要とせずにアイデアをアニメーションできるツールを提供することです。解像度、期間、アクセス層によってまだ制約がありますが、Googleが毎日の創造的なワークフローに持ち込むことを目的としたGoogleの意図の最も明確な例でもあります。