Google telah mengeluarkan penjana video AI yang paling maju, Veo 3, kepada pemaju, melancarkan pratonton berbayar hari ini melalui API Gemini dan Vertex AI. Langkah ini, yang mana harga 720p video dengan audio yang disegerakkan pada $ 0.75 sesaat, merupakan langkah penting dalam strategi Google untuk mengewangkan alat kreatifnya yang kuat.
Pelepasan API mengikuti siri kemas kini yang cepat yang baru-baru ini membawa ciri-ciri imej-ke-video dan akses global kepada pelanggan AI Google. Target=”_ Blank”> Akses Pembangun Baru adalah pengembangan kritikal untuk model yang, sehingga kini, adalah ciri yang dihadapi pengguna. API kini menyokong generasi teks-ke-video, dengan Google menjanjikan keupayaan imej-ke-video sedang dalam perjalanan. Mod yang lebih cepat, lebih efektif”Veo 3 Fast”juga dijadualkan untuk pelepasan API masa depan. Google Deepmind VP Eli Collins menyatakan bahawa”Veo 3 cemerlang dari teks dan imej yang mendorong kepada fizik dunia nyata dan penyegerakan bibir yang tepat.”Keupayaan ini merupakan bahagian penting dalam mendedahkan awal, dengan Ketua Pegawai Eksekutif Demis Hassabis mengisytiharkan bahawa dengan teknologi ini,”Kami muncul dari era senyap generasi video.”
Untuk membantu pemaju memulakan, Google menyediakan templat SDK dan aplikasi starter untuk Prototaip cepat di Google AI Studio . Ini membolehkan percubaan cepat sebelum melakukan integrasi berskala penuh, langkah penting yang diberikan kos berasaskan penggunaan. href=”https://developers.googleblog.com/en/veo-3-now-available-mini-api/”target=”_ blank”> Kandungan brainstorm, cepat berulang, dan meningkatkan kecekapan . Contoh-contoh awal ini menunjuk ke arah aliran kerja yang sangat khusus, profesional di mana kos model boleh dibenarkan oleh penjimatan masa dan pecutan kreatif. Syarikat menggunakan Veo 3 untuk menghasilkan tindakan manusia yang realistik dan cecair yang berfungsi sebagai data asas bagi saluran paipnya, menjadikan output AI menjadi animasi watak yang dicuri untuk pelanggan.
href=”https://www.youtube.com/watch?v=zki-bltwjx4″target=”_ blank”> Menghasilkan cutscenes video dalam permainan yang memajukan cerita dalam RPG yang akan datang, Wit’s End. Ini membolehkan pereka untuk dengan cepat bereksperimen dengan idea-idea dan visual naratif baru, kelebihan utama dalam kitaran berulang pembangunan permainan.
Kes-kes penggunaan yang dipilih dengan teliti ini khususnya khusus, yang mungkin menunjukkan bahawa integrasi yang lebih besar dan lebih banyak lagi belum siap untuk pengumuman awam. Ini adalah strategi yang sama untuk melancarkan teknologi baru yang kuat tetapi mahal, memberi tumpuan pertama kepada industri khusus yang dapat menyerap kosnya dengan segera.
Struktur harga menggariskan tumpuan profesional ini. Menurut Kadar rasmi Google , klip lapan saat berharga $ 6, manakala video lima minit akan berjalan $ 225. Memandangkan menghasilkan hasil yang sempurna sering memerlukan pelbagai percubaan, kos dunia nyata dapat meningkat dengan cepat.
Sebagai satu analisis menunjukkan, mewujudkan lima minit rakaman yang boleh digunakan mungkin memerlukan penjanaan sepuluh kali jumlah itu, yang berpotensi menolak jumlah kos ke arah $ 2,250. Google bertaruh bahawa untuk kes-kes penggunaan tertentu, ini masih jauh lebih murah daripada kaedah pengeluaran video tradisional.
[Kandungan tertanam]
Sekeping terakhir strategi AI yang lebih luas
Akses pemaju mengikuti pelepasan global model kepada pelanggan AI Pro pada awal bulan Julai dan penambahan keupayaan imej-ke-video hanya minggu lepas. Struktur ini mewujudkan perbezaan yang jelas antara arus perdana $ 19.99/bulan pelan AI Pro, yang bertujuan untuk penerokaan kreatif umum, dan $ 249.99/bulan AI Ultra Rancangan untuk profesional. API kini menyediakan jalan ketiga yang berbeza untuk mengakses teknologi, satu yang ditujukan tepat pada integrasi komersial dan bukannya penggunaan individu.
Pelepasan ini meletakkan Google untuk bersaing lebih langsung dengan pesaing seperti OpenAI dalam perlumbaan penting untuk menyediakan model AI asas kepada pemaju dan perusahaan. Dengan meletakkan tag harga pada model video yang paling maju, Google membuat pernyataan yang jelas mengenai cita-cita komersilnya di pasaran AI generatif.
Untuk menangani kebimbangan yang tidak dapat dielakkan mengenai penyalahgunaan dan deepfake, semua video yang dihasilkan melalui API akan termasuk air sintetik digital. Ini adalah bahagian utama komitmen Google yang dinyatakan untuk pembangunan AI yang bertanggungjawab dan memberikan ketelusan untuk media yang dihasilkan AI. Walau bagaimanapun, teknologi itu bukan peluru perak, seperti Kajian akademik telah menyatakan bahawa watermark tidak menjadi kebocoran. Sebagai pembuat filem Darren Aronofsky