Googleは、ビジネスクライアント向けの人工知能ツールキットを拡大し、 2025年4月9日の次の会議、主にvertex aiプラットフォームのターゲティングを行う間に、メディア生成モデルの実質的な更新を明らかにします。クイックフォロースルーを実証する同社のVEO 2ビデオ生成モデルは、4月11日に選択したユーザーのために登場し始めました。Googleの ai Studioプラットフォーム gemini apiを介してアクセスできます。
最初のロールアウトにより、VEO 2での米国ベースのユーザーの実践的なエクスペリエンスが得られます。早期アクセスは限られているように見えます。米国外のユーザーは、VPNのような技術的な回避策が必要になる場合があります。初期のテスターによって報告され、Googleの開発者ブログで確認された現在の機能は、720p解像度と24フレームに設定され、最大ビデオ期間は8秒です。この最初の展開は、Googleがvertex AIでプレビューを入力する新しいVEO 2の機能を詳述したクラウドの次の発表に続きます。バックグラウンドの除去または時点として。 Vertex AIでの機能プレビューとAIスタジオでのモデルロールアウトの分離は、個々のクリエイターまたはテスターと比較してエンタープライズ開発者とテスターのさまざまなアクセス経路を示唆しています。 AIミュージックジェネレーションを追加
ビデオとともに、Googleは承認された顧客のために頂点AIのテキストから音楽へのAIモデルであるLyriaを紹介しました。 href=”https://docs.google.com/forms/d/1yktciizy6txfknq9pzybxglzoeh0ljmunhjubi1m/viewform?edit_requested=true”ターゲット=”_ _ blank request form Googleは、Lyriaがテキストの指示からさまざまなジャンルにわたって完全な音楽作品を作成したり、マーケティングキャンペーンや没入型エクスペリエンスのカスタムオーディオを作成したり、従来のストックミュージックライブラリと関連するライセンスの複雑さに依存する可能性があることを示唆しています。 3、Googleのオーディオ生成と理解モデルは、一般的にVertex AIで利用可能になります。 2025年3月頃に報告された以前のプレビューフェーズに続いて、Chirp 3には「インスタントカスタム音声」機能が正式に含まれています。Googleは、わずか10秒のオーディオから音声をクローン化できると主張しています。複数のスピーカーオプションと、適切な使用許可を確認するために、記載されている検証プロセスの下で動作します。 Chirp 3は、録音の異なるスピーカーを区別するように設計された転写ツールも導入しています。
画像生成は除外されませんでした。頂点AIで以前のプレビューロールアウトを見たImagen 3は、Cloud Nextで発表されたさらなる機能強化を受けました。これらの改善は、不足している画像部品の再構築の改善(パインティング)と高品質のオブジェクトの削除に焦点を当てており、以前のバージョンと比較してより現実的で詳細な画像出力を目指しています。 Googleの公式ブログは、ビデオ、画像、スピーチ、音楽に及ぶ生成モデルを独自に提供するものとして頂点AIを強調しました。この戦略は、GoogleをAmazon Bedrockなどの他のクラウドAIプラットフォームと直接競争させています。 Cloud Nextイベントでは、Ironwood TPUなどの新しいカスタムシリコンやエージェント開発キット(ADK)などのフレームワークなど、より広範なAIの発表も見られ、Google Cloudの顧客の幅広いAIフォーカスを示しています。 Googleは、Imagen、Veo、Lyriaなどの新しいモデルによって生成されたメディアがSynthID透かしを組み込んだと述べました。同社はまた、有害なコンテンツの作成と音声クローニングツールの特定の検証プロセスに対する組み込みの保護ガードを参照しました。
しかし、Googleはこれらの強力なモデルのトレーニングに使用されるデータセットを指定しませんでした。これは業界全体での繊細なトピックのままであり、