Google sedang mengembangkan akses kepada Veo, model penjanaan video AI lanjutannya, menjadikannya tersedia untuk pelanggan perusahaan terpilih melalui Vertex AI. Langkah ini meletakkan Google di barisan hadapan video AI generatif, kerana pesaing seperti OpenAI menghadapi cabaran yang semakin meningkat.

Veo Menawarkan Video AI Definisi Tinggi untuk Perusahaan

Didedahkan awal tahun ini di Google I/O, Veo ialah penjana video terkini yang mampu mencipta video 1080p pada 24 atau 30 bingkai sesaat. Dengan keupayaannya untuk menghasilkan gaya sinematik seperti selang masa dan tangkapan udara, Veo membenarkan perniagaan menghasilkan kandungan dinamik dengan teks ringkas atau gesaan imej.
 
[kandungan terbenam]

“Veo menyediakan yang tidak pernah berlaku sebelum ini tahap kawalan kreatif dan memahami istilah sinematik seperti’timelapse’atau’tangkapan udara landskap,'”kata Google dalam pengumumannya pada bulan Mei.

Pelanggan perusahaan kini boleh mengakses alat secara peribadi pratonton, memanfaatkannya untuk memperkemas aliran kerja merentas industri pemasaran, hiburan dan media sosial.

YouTube Shorts turut menyepadukan Veo, membolehkan pencipta menjana klip enam saat dan latar belakang video animasi mulai tahun ini, dengan kefungsian penuh dijangka menjelang 2025.

Veo menggabungkan SynthID, teknologi penanda air yang dibangunkan oleh Google DeepMind SynthID membenamkan penanda halimunan ke dalam video yang dijana AI, memastikan keasliannya sambil menangani kebimbangan mengenai maklumat salah dan hak cipta. Ciri ini melengkapkan aplikasi perusahaan Veo, memberikan keyakinan perniagaan terhadap integriti kandungan mereka.
 
[kandungan terbenam]

Imej 3 pada Vertex AI

Platform AI Vertex Google juga termasuk Imagen 3, penjana teks-ke-imej tercanggih yang baru-baru ini tersedia untuk umum. Imagen 3 menghasilkan imej yang sangat realistik dengan perhatian yang luar biasa terhadap perincian, seperti tekstur halus dan kesan pencahayaan, berdasarkan gesaan perbualan.

Ia termasuk ciri penyuntingan lanjutan seperti mengecat dan mengecat luar, yang membolehkan pengguna mengubah suai atau mengembangkan bahagian imej dengan menerangkan perubahan yang dikehendaki. Model ini juga menawarkan pilihan penyesuaian untuk penjenamaan, membolehkan perniagaan menjana imej yang sejajar dengan gaya atau logo tertentu.

Berkaitan: Iklan Amazon Memperkenalkan Audio AI dan Studio Kreatif untuk Pengiklan

p>

Kebocoran Sora OpenAI Menyoroti Cabaran Industri

Sementara Google memajukan keupayaan AI videonya, OpenAI menghadapi tindak balas selepas keluaran tanpa kebenaran API Soranya pada Wajah Memeluk. Sora, direka untuk menjana video hiper-realistik 10 saat, pada mulanya hanya tersedia kepada kumpulan penguji yang terhad. Walau bagaimanapun, peserta menuduh OpenAI mengeksploitasi buruh tidak bergaji dan mengenakan sekatan yang berlebihan ke atas kerja mereka.

“Program akses awal ini nampaknya kurang mengenai ekspresi kreatif dan kritikan, dan lebih banyak lagi mengenai PR dan ,”kata penguji dalam pengumuman bocor itu. Mereka mengkritik dasar OpenAI, yang memerlukan kelulusan syarikat untuk sebarang output bersama, mengehadkan keupayaan mereka untuk mempamerkan kerja.

Sora’s halangan teknikal menambah kekecewaan ini Versi awal alat memerlukan lebih daripada 10 minit untuk menghasilkan satu minit video, mencerminkan permintaan pengiraan yang ketara Walaupun OpenAI membangunkan”varian turbo”yang lebih pantas, Sora tetap tidak tersedia kepada orang ramai.

Ketua Pegawai Produk OpenAI Kevin Weil menjelaskan semasa Reddit AMA: “Menskalakan infrastruktur pengiraan dan menangani risiko penyamaran telah menjadi keutamaan kami. Ini adalah cabaran yang kompleks, tetapi kami komited untuk menyelesaikannya sebelum keluaran yang lebih luas.”

Berkaitan: Alibaba, MiniMax yang Disokong Tencent Melancarkan Penjana Video AI

Tekanan Persaingan daripada Adobe, Runway ML dan Open Source

landskap AI generatif menjadi semakin kompetitif, dengan syarikat seperti Adobe dan Runway ML menolak sempadan dalam video pengeluaran:

Perkembangan ini menunjukkan keperluan mendesak untuk Google dan OpenAI menangani kedua-dua cabaran teknikal dan etika untuk kekal berdaya saing.

Berkaitan: Kestabilan AI Memperkenalkan Stabil Video 4D untuk Penjanaan Video Dipertingkat

Pertimbangan Etika dalam Alat Video AI

Kebocoran Sora telah mencetuskan perbincangan baharu tentang etika dalam Pembangunan AI. Pengkritik berpendapat model kerjasama terhad OpenAI dan pergantungan pada penguji tidak berbayar sangat berbeza dengan tumpuan Google pada ketulenan kandungan dan penggunaan data latihan berlesen oleh Adobe.

Penanda air halimunan SynthID menawarkan kelebihan yang jelas dalam menangani maklumat salah dan memastikan kandungan kebolehkesanan, manakala Kredensial Kandungan Adobe menetapkan standard untuk akauntabiliti dalam media yang dijana AI. Alat ini mencerminkan usaha yang lebih luas untuk mewujudkan kepercayaan dan ketelusan dalam bidang yang berkembang pesat.

Ketika Google mengembangkan akses kepada Veo, pendekatannya menyerlahkan kepentingan menggabungkan inovasi dengan perlindungan etika. Dengan memenuhi keperluan kedua-dua perusahaan dan pencipta individu, syarikat itu nampaknya meletakkan dirinya dengan baik sebagai peneraju dalam pengeluaran video berkuasa AI generasi akan datang.

Categories: IT Info