Google secara signifikan meningkatkan pembuatan konten intelijen buatan Arsenal, meluncurkan VEO 3, model pembuatan video terbarunya yang sekarang mampu membuat dan mengintegrasikan audio, termasuk dialog dan efek lingkungan. Langkah ini secara langsung menantang pesaing seperti Openai’s Sora, dengan Audio Terpadu sebagai pembeda utama. Bersamaan dengan Veo 3, Google memperkenalkan aliran , alat pembuatan film AI baru, dan Imagen 4 untuk peningkatan gambar yang baru, menandakan kapabilitas baru-baru ini. $ 249,99 per bulan AI Ultra Plan, dengan akses perusahaan melalui Vertex AI. This pricing strategy underscores Google’s intent to monetize its advanced AI, offering powerful tools that could transform creative workflows for filmmakers, marketers, and artists by simplifying the production of more immersive content.
Veo 3: Bringing Sound to AI-Generated Video
Veo 3 marks a notable advancement by incorporating native audio generation, a feature its pendahulu, veo 2, kurang. Eli Collins, wakil presiden produk Google DeepMind, menyatakan bahwa”VEO 3 unggul dari teks dan gambar yang diminta untuk fisika dunia nyata dan sinkronisasi bibir yang akurat.”Ini dibangun di atas fondasi Veo 2, yang sudah menawarkan output 4K dan memahami prompt sinematik, setelah dilatih pada”bahasa sinematografi.”
[Konten Tertanam]
Kemampuan untuk menghasilkan audio yang disinkronkan-dari dialog karakter dengan sinkronisasi bibir hingga kebisingan latar belakang sekitar-secara langsung dalam proses pembuatan video adalah langkah yang signifikan. CEO Google DeepMind Demis Hassabis berkomentar bahwa dengan VEO 3,”Kami muncul dari era sunyi generasi video.”
[Konten Tertanam]
Evaluasi internal Google untuk VEO 2 telah menyarankan keunggulan kompetitif, dengan 59% pengguna dikabarkan lebih memilih output visualnya daripada Sora Turbo. Veo 3 is also in private preview on Vertex AI, where it can generate video from text and image prompts, incorporating speech and various audio elements.
Flow: A Dedicated Toolkit for AI Filmmaking
The newly introduced AI filmmaking tool, Flow, is engineered for creatives, integrating Google’s leading models: Veo for video, Imagen for generating visual “ingredients”like characters or scenes from text, and Gemini for intuitive, natural language prompting. The Google Blog describes Flow as an evolution of the VideoFX Google Labs experiment, designed to make creation “effortless, iterative, and full of possibility.”
[embedded content]
Google menjelaskan bahwa aliran dirancang khusus untuk VEO, memanfaatkan kepatuhan yang luar biasa dan kemampuannya untuk menghasilkan output sinematik yang menakjubkan dan realistis, sementara Gemini memfasilitasi pemisahan intuitif dalam bahasa sehari-hari, dan Imagen memungkinkan pengguna untuk membuat atau mengimpor aset dengan konsisten.
aliran mencakup fitur seperti Kontrol Kais Presisi, PENGEMBALIAN AKURAN. Manajemen, dan flow tv —sebuah showcase dari Google Labs di mana pengguna dapat belajar dari petunjuk dan teknik yang tinggi. Akses awal ke VEO 3 dengan audio terintegrasi.
Google menyoroti kolaborasi dengan pembuat film seperti Dave Clark, yang menggunakan aliran untuk pengembangan film pendek. Pembuat film Darren Aronofsky mengomentari lanskap yang berkembang, yang menyatakan bahwa”Pembuatan film selalu didorong oleh teknologi,”dan menambahkan bahwa”sekarang adalah momen untuk mengeksplorasi alat-alat baru ini dan membentuknya untuk masa depan mendongeng.”
imagen 4 dan peningkatan yang lebih luas pagar 4 dan peningkatan yang lebih luas pojene nicen dan peningkatan yang lebih luas
pojene nicen dan peningkatan yang lebih luas. Kecepatan yang lebih baik, kinerja, dan generasi detail halus. PetaPixel also detailed that Imagen 4 supports various styles, more aspect ratios, up to 2K resolution, and is better at rendering text, with a “fast variant”planned to be up to 10 times faster than Imagen 3.
Image generated with Imagen 4 (Source: Google)
This addresses past criticisms of Google’s image generation, such as when Imagen 3 produced historically inaccurate results, an issue Google co-founder Sergey Brin dikaitkan dengan kurangnya”pengujian menyeluruh.” Imagen 4 adalah
Potongan ini. CEO OpenAI Sam Altman, misalnya, mengatakan bahwa generator gambar 4O ChatGPT sangat banyak digunakan setelah peluncurannya sehingga menyebabkan chip komputasi perusahaan menjadi”meleleh.” Model berlangganan berjenjang Google untuk aliran dan”https”https:/eon”https:/eon”Bundel alat-alat ini dengan YouTube Premium dan 30TB penyimpanan cloud Konteks pasar, dan pertimbangan Video yang berkelanjutan
Pertimbangan etis dan pengembangan AI yang bertanggung jawab tetap pusat. All content from Veo 3, Imagen 4, and Lyria 2 will feature SynthID watermarks, and Google has introduced a public SynthID Detector tool to verify AI-generated content.
Namun, transparansi mengenai dataset yang digunakan untuk melatih model-model ini terus menjadi subjek diskusi industri, terutama dengan peraturan seperti Undang-Undang AI Uni Eropa. Catatan Kebijakan Privasi Gemini Google Koleksi data dari obrolan dan file. Pada akhirnya, visi Google, seperti yang diartikulasikan sebelumnya oleh CEO DeepMind Demis Hassabis adalah untuk”Google pada akhirnya akan menggabungkan model Gemini dan Veo AI untuk meningkatkan pemahaman dunia fisik,”menunjukkan masa depan aplikasi AI multimodal yang bahkan lebih terintegrasi.