Google は、クリエイターのクリエイティブなコントロールとリアリズムを強化する AI 動画生成モデルの大幅なアップデートである Veo 3.1 をリリースしました。新しいバージョンは、Google の AI 映像制作ツールである Flow に展開され、より詳細な編集機能が導入されています。

ユーザーはシーンにオブジェクトを追加し、Flow のすべての高度な機能でより豊かで同期されたオーディオの恩恵を受けることができます。このアップデートは、即時遵守とビジュアル品質も向上させるもので、Flow エディタ、Gemini アプリ、および 開発者向け Gemini API

この動きは、生成ツールをより強力かつ直感的にするという Google の意図を示しています。 5 月に Flow が開始されて以来、ユーザーは 2 億 7,500 万本を超えるビデオを作成しており、アクセスしやすい AI ビデオ作成に対する強い需要が示されています。このリリースは、OpenAI の Sora 2 に対する直接的な競合他社の動きとみなされています。

フロー内でより詳細なクリエイティブ コントロールが実現

Google は発表の中で、このアップデートを、より洗練された生成後ツールに対するクリエイターからのフィードバックへの直接的な対応として位置づけました。

製品リーダーの Jess Gallegos と Thomas Iljic によると、「私たちは常に皆さんのフィードバックに耳を傾けており、 すべての機能にわたるオーディオのサポートを強化して、Flow 内でより芸術的なコントロールを求めていると聞きました。」

ユーザー主導のイテレーションに重点を置くことは、Flow を純粋な生成エンジンからより包括的でインタラクティブなクリエイティブ スイートに移行するという戦略的転換を示しています。

この取り組みの目玉は、最初のテイクが最終テイクではない瞬間のために設計された、Flow エディター内の一連の新しい編集ツールです。

[embedded] content]

最も注目すべき追加機能は「挿入」機能で、クリエイターは、微妙で現実的なディテールから完全に幻想的な生き物まで、すでに生成されたビデオ クリップに新しい要素を追加できるようになります。

ユーザーがアプリケーション内で直接シーンを再考して完成させることができるように設計されており、微調整や追加のための外部編集ソフトウェアの必要性が減ります。

Google によると、このモデルの 洗練された機能により、これらの追加が自然で文脈的に適切に見えるようになります。 Veo 3.1 は、既存のシーンをインテリジェントに分析して、影や環境光などの複雑な詳細を処理し、新しいオブジェクトが環境に確実に定着するようにします。

さらに、モデルは、挿入された要素をクリップの確立された芸術的スタイルにブレンドするように機能します。この機能は単純なオブジェクトの配置を超えて、AI が生成したコンテンツを洗練するためのより動的で一貫した方法を提供します。

この新機能を補完するものとして、Google はまた、対応する「削除」機能が Flow エディターに「近日登場」することも発表しました。

これにより、ユーザーは不要なオブジェクトやキャラクターをシーンからシームレスに削除できるようになります。同社は、Flow が背景と周囲を自動的に再構築し、あたかもその物体が存在しなかったかのように見せると説明しました。

これらの機能を合わせて、AI ビデオ用の完全なインペイントおよびアウトペイント ツールキットの提供に向けた重要な一歩を表します。

サイレント クリップからリッチ オーディオ ストーリーテリングまで

Veo 3.1 リリースの主な焦点は、オーディオの拡張です。 能力。サウンドを統合した最初の Google モデルである Veo 3 の基盤に基づいて構築されたこのアップデートにより、Flow の最も高度なクリエイティブ機能にオーディオ生成が追加されました。

この機能強化により、以前の AI ビデオ ツールの重要な制限が解決されました。 Google DeepMind CEO のデミス・ハサビス氏が以前宣言したように、「私たちはビデオ生成のサイレント時代から脱しつつあります。」このアップデートは、ダイアログ、サウンドエフェクト、環境ノイズを追加することで、そのビジョンを実現するための重要なステップです。

リアリズムへの重点は、大規模なポストプロダクション作業を行わずに、信頼できる魅力的なコンテンツを作成するために重要です。

クリエイターは、キャラクターやスタイルを制御するために参照画像を使用する「Ingredients to Video」などの機能を使用するときに、豊かな同期オーディオを生成できるようになりました。 2 つの画像間のトランジションを作成するための「ビデオへのフレーム」ツールに音声も含まれるようになりました。

[埋め込みコンテンツ]

より長い連続ショットの作成に使用される「拡張」機能は、付随するサウンドスケープも生成するようになり、ショットやより長い物語シーケンスを確立するのにさらに便利になります。

AI ビデオ レースにおける戦略的展開

Google は、リーチを最大化するために、AI 製品スイート全体に Veo 3.1 を導入しています。消費者向けの Flow エディターと Gemini アプリを超えて、このモデルは開発者と企業顧客にも利用できるようになりました。

開発者は、Gemini API の有料プレビューを通じて Veo 3.1 とその新機能にアクセスでき、以下のことが可能になります。 強力なビデオ生成機能を独自のアプリケーションに統合します。企業クライアントは、Vertex AI を通じてこのモデルを活用できます。

この多角的な配信戦略は、急速に進化する AI 動画分野で競争したいという Google の野心を示しています。このリリースは、物議を醸した OpenAI の Sora 2 アプリのリリース直後に行われ、著作権とディープフェイクの懸念をめぐる即座の反発に直面しました。

対照的に、Google は、生成されたすべてのコンテンツに SynthID のウォーターマークを埋め込み、責任ある AI への取り組みを強調し続けています。この戦略は、Veo をより安定したエンタープライズ対応の代替手段として位置付けるために計算されたものと思われます。

今回のアップデートは、Google の明確化された 2 段階のサブスクリプション戦略も強化し、導入を促進し忠実なユーザー ベースを構築する AI Pro および AI Ultra 計画に具体的な価値を追加します。

AI 映画制作の未来を形作る

急速な進化 生成ビデオ ツールの導入により、クリエイティブ産業に変革がもたらされると期待されています。 Veo 3.1 のきめ細かい編集コントロールと統合オーディオの導入により、高品質ビデオ制作の技術的な障壁が低くなり、ストーリーテラーがより迅速にアイデアを反復できるようになります。

これらのプラットフォームが成熟するにつれて、それらは目新しいものではなくなり、ストーリーボードから最終制作に至るクリエイティブ ワークフローの不可欠な部分になりつつあります。焦点は、単純なテキストからビデオへの出力から、人間の作成者と AI モデルの間のよりインタラクティブで協調的なプロセスに移行しています。

Categories: IT Info