Google telah mengeluarkan VEO 3.1, kemas kini yang ketara kepada model penjanaan video AI yang meningkatkan kawalan kreatif dan realisme untuk pencipta. Versi baru ini dilancarkan ke alat pembuatan filem AI Google, aliran , memperkenalkan lebih banyak keupayaan penyuntingan berbutir. Kemas kini, yang juga meningkatkan pematuhan dan kualiti visual yang cepat, sedang disediakan dalam editor aliran, aplikasi gemini , dan melalui Gemini API untuk pemaju . Sejak pelancaran Flow pada bulan Mei, pengguna telah mencipta lebih daripada 275 juta video, menunjukkan permintaan yang kukuh untuk penciptaan video AI yang boleh diakses. Pelepasan ini dilihat sebagai langkah kompetitif langsung terhadap Sora 2. href=”https://blog.google/technology/ai/veo-pdates-flow/”target=”_ blank”> Dalam pengumumannya , Google membingkai kemas kini sebagai respons langsung kepada maklum balas pencipta untuk alat-alat yang lebih canggih. dan kami telah mendengar bahawa anda mahukan lebih banyak kawalan artistik dalam aliran, dengan peningkatan sokongan untuk audio merentas semua ciri.”

[Kandungan tertanam]

Tambahan yang paling ketara adalah ciri”memasukkan”, yang memberi kuasa kepada pencipta untuk menambah unsur-unsur baru-dari butiran yang halus, realistik kepada makhluk yang sepenuhnya fantastik-ke dalam klip video yang telah dijana. Kepada Google, kecanggihan model memastikan penambahan ini kelihatan semulajadi dan kontekstual sesuai. VEO 3.1 secara bijak menganalisis adegan yang sedia ada untuk mengendalikan butiran kompleks seperti bayang-bayang dan pencahayaan ambien, memastikan objek baru didasarkan pada alam sekitar. Keupayaan ini bergerak melampaui penempatan objek mudah, yang menawarkan cara yang lebih dinamik dan kohesif untuk memperbaiki kandungan yang dihasilkan oleh AI. Syarikat itu menjelaskan bahawa aliran secara automatik akan membina semula latar belakang dan persekitaran secara automatik, menjadikannya kelihatan seolah-olah objek itu tidak pernah ada. keupayaan audio. Membina asas Veo 3, yang merupakan model Google pertama untuk mengintegrasikan bunyi, kemas kini kini membawa generasi audio ke fungsi kreatif yang paling maju Flow.

Peningkatan ini menangani had utama alat video AI yang terdahulu. Sebagai CEO Google Deepmind Demis Hassabis sebelum ini menyatakan,”Kami muncul dari era senyap generasi video.”Kemas kini ini merupakan langkah penting dalam memenuhi visi itu, menambah dialog, kesan bunyi, dan bunyi ambien. Alat”bingkai ke video”, untuk mewujudkan peralihan antara dua imej, kini juga termasuk audio.

[Kandungan tertanam]

Ciri”Extend”, yang digunakan untuk membuat tembakan yang lebih lama, sekarang juga akan menghasilkan soundscapes yang disertakan,

Google menggunakan VEO 3.1 di seluruh suite produk AI untuk memaksimumkan jangkauannya. Di luar editor aliran yang dihadapi pengguna dan aplikasi Gemini, model ini kini tersedia untuk pemaju dan pelanggan perusahaan.

Pemaju boleh mengakses VEO 3.1 dan ciri-ciri barunya melalui

Strategi ini muncul dikira untuk meletakkan veo sebagai alternatif yang lebih stabil dan siap sedia. Alat video dijangka mengubah industri kreatif. Pengenalan kawalan pengeditan halus dan audio bersepadu dalam VEO 3.1 merendahkan halangan teknikal untuk pengeluaran video berkualiti tinggi, yang membolehkan pencerita untuk mengulangi idea-idea lebih cepat. Tumpuannya beralih dari output teks-ke-video mudah ke proses yang lebih interaktif dan kolaboratif antara pencipta manusia dan model AI.