Googleは、最も高度なAIビデオジェネレーターであるVeo 3を開発者にリリースし、Gemini APIとVertex AIを通じて今日有料プレビューを開始しました。同期オーディオを1秒あたり0.75ドルで価格設定したこの動きは、強力な創造ツールを収益化するGoogleの戦略の重要なステップです。

これにより、開発者は単一のプロンプトから高解像度ビデオ、ダイアログ、およびサウンドエフェクトを生成するモデルを統合します。 APIリリースは、最近画像からビデオへの機能をもたらし、GoogleのAIサブスクライバーへのグローバルアクセスをもたらした一連の更新に続きます。ターゲット=”_ blank”>新しい開発者アクセスは、これまで主に消費者向けの機能であったモデルの重要な拡張です。 APIは現在、テキストからビデオへの生成をサポートしており、Googleは画像間の機能が進行中であると約束しています。より速く、より費用対効果の高い「VEO 3 FAST」モードは、将来のAPIリリースにも予定されています。 Google DeepMind VP Eli Collinsは、「VEO 3は、実世界の物理学と正確なリップシンクにテキストと画像のプロンプトから優れている」と述べました。この能力は最初の公開の重要な部分であり、CEOのDemis Hassabisは、このテクノロジーで「ビデオ生成の静かな時代から出現している」と宣言しました。 href=”https://console.cloud.google.com/freetrial/?redirectpath=/vertex-ai/studio/media/generate; tab=video”target=”_ blank”> Google AI Studio での迅速なプロトタイピング。これにより、本格的な統合にコミットする前に迅速な実験が可能になります。これは、使用法ベースのコストを考慮して重要なステップです。

初期の実験:3Dアニメーションからゲームシネマティクスへhref=”https://developers.googleblog.com/en/veo-3-now-abailable-gemini-api/”ターゲット=”_ blank”>ブレインストーミングコンテンツ、迅速に反復し、効率を改善します。これらの最初の例は、時間の節約と創造的な加速によってモデルのコストを正当化できる高度に専門的でプロフェッショナルなワークフローを示しています。たとえば、

アニメーション会社Cartheel 同社はVEO 3を使用して、パイプラインの基礎データとして機能する現実的で流動的な人間の行動を生成し、AI出力をクライアントのリグ付き文字アニメーションに変えます。 href=”https://www.youtube.com/watch?v=zki-bltwjx4″ターゲット=”_ blank”>ゲーム内のビデオカットシーンを生産今後のRPGであるWit’s Endでストーリーを前進させます。これにより、デザイナーは新しい物語のアイデアとビジュアルを迅速に実験することができます。これは、ゲーム開発の反復サイクルの重要な利点です。

これらの慎重に選択されたユースケースは、特に専門化されています。これは、強力でありながら高価な新しいテクノロジーを展開するための一般的な戦略であり、最初にコストをすぐに吸収できるニッチ産業に焦点を当てています。

価格構造はこの専門的な焦点を強調しています。 Googleの公式料金によれば、8秒のクリップの費用は6ドル、5分間のビデオは225ドルです。完璧な結果を生成するには複数の試行が必要であるため、実際のコストが迅速にエスカレートする可能性があります。

1つの分析が指摘するように、5分間の使用可能な映像を作成すると、その10倍の量を生成する必要があり、総コストを2,250ドルに押し上げる可能性があります。 Googleは、特定のユースケースでは、これは従来のビデオ制作方法よりもかなり安いことを賭けています。開発者アクセスは、7月上旬にAI Proサブスクライバーへのモデルのグローバルリリースと、先週の画像からビデオへの機能の追加に続きます。この構造は、一般的な創造的探査を目的とした主流の$ 19.99/月AI Proプランと、専門家向けのハイエンド$ 249.99/月AIウルトラプランとの間に明確な区別を作成します。 APIは、テクノロジーにアクセスするための3番目の明確なパスを提供するようになりました。1つは個々の使用ではなく商業統合を目的としています。 Googleは、最も高度なビデオモデルに値札を付けることで、生成AI市場での商業的野望について明確な声明を発表しています。

誤用とディープフェイクに関する避けられない懸念に対処するために、APIを介して生成されたすべてのビデオにはデジタルシンセド透かしが含まれます。これは、Googleが責任あるAI開発に対する指示されたコミットメントの中心的な部分であり、AIに生成されたメディアに透明性を提供します。ただし、テクノロジーは銀の弾丸ではありません。アカデミック研究は、透かしが愚かではないことに注意しています。映画製作者のdarren aronofsky