Pinahusay ng Google Ngayon ang modelo ng VEO 3 AI na may bagong kakayahan sa imahe-sa-video, na nagpapahintulot sa mga gumagamit na baguhin ang isang solong larawan sa isang walong segundo clip ng video na may tunog. Ang tampok na ito ay lumiligid ngayon sa mga tagasuskribi ng AI Pro at AI Ultra na plano sa pamamagitan ng Gemini app. Ang pag-update na ito ay dumating habang ang ulat ng Google ay kahanga-hangang maagang pag-aampon para sa VEO 3, kasama ang mga gumagamit na lumilikha ng higit sa 40 milyong mga video sa loob lamang ng pitong linggo. Sinusundan nito ang pandaigdigang paglulunsad ng text-to-video function ng VEO noong nakaraang linggo, na pinapatibay ang push upang gumawa ng mga advanced na generative AI tool na pang-araw-araw na mapagkukunan. Ang paglipat ng larawan Ang kakayahang makabuo ng naka-synchronize na audio, kabilang ang mga diyalogo at nakapaligid na mga epekto, ay isang pangunahing pagkakaiba-iba. Ipinahayag ng Google DeepMind CEO na si Demis Hassabis na sa modelong ito,”Lumilitaw kami mula sa tahimik na panahon ng henerasyon ng video.”Si Eli Collins, isang Google DeepMind VP, ay naka-highlight sa pagiging sopistikado ng modelo, na binanggit na ang”veo 3 ay nangunguna mula sa teksto at imahe na nag-uudyok sa pisika na tunay na mundo at tumpak na pag-sync ng labi.”Ang pokus na ito sa pisika at pag-sync ng labi ay mahalaga para sa mapagkakatiwalaang nilalaman. Sa loob ng gemini app, piliin ng mga gumagamit ang pagpipilian na”Mga Video”, mag-upload ng larawan, at pagkatapos ay magbigay ng mga tagubilin sa teksto para sa nais na animation at kasamang mga audio effects. Ang daloy ay nagsasama ng veo para sa video, imagen para sa mga assets ng imahe, at gemini para sa natural na pag-uudyok ng wika, na lumilikha ng isang komprehensibong suite para sa mga advanced na proyekto ng malikhaing. Mga output. Ito ay isang hindi mapag-aalinlanganan na bahagi ng proseso ng henerasyon para sa lahat ng mga gumagamit. Nilalayon ng Kumpanya na magbigay ng transparency at matiyak na ang nilalaman ng AI-nabuo ay maaaring malinaw na matukoy, isang mahalagang hakbang habang ang mga tool na ito ay nagiging mas malakas.
Gayunpaman, ang solusyon ay hindi maloko. Ang isang independiyenteng pag-aaral mula sa University of Maryland ay natagpuan na ang mga watermark ay maaaring mahina laban sa pagmamanipula. Nagtapos ang mga mananaliksik,”Ang mga watermark ay nag-aalok ng halaga sa mga pagsusumikap sa transparency, ngunit hindi sila nagbibigay ng ganap na seguridad laban sa ai-generated na pagmamanipula ng nilalaman,” na pinapahiwatig ang patuloy na lahi ng teknolohikal na armas sa pagitan ng henerasyon at pagtuklas . Mas malinaw na diskarte sa subscription
Ang overhaul ay idinisenyo upang wakasan ang matagal na pagkalito ng tatak at lumikha ng isang mas malinaw na panukala ng halaga. Nagbibigay ito ng mga gumagamit ng 2 TB ng imbakan, ang modelo ng Gemini 2.5 Pro, at 1,000 buwanang mga kredito ng AI, na sinabi ng Google na nagbibigay ng”sapat na silid para sa malikhaing paggalugad”. Nag-bundle ito ng 30 TB ng imbakan, isang subscription sa premium ng YouTube, at isang napakalaking 12,500 buwanang kredito para sa masinsinang paggamit. Ito ay nabigyang-katwiran na may maagang pag-access sa mga tool na pang-eksperimentong tulad ng ahente ng Project Mariner AI. Ang paglipat sa tatlong libreng pang-araw-araw na henerasyon ng Veo 3 ay isang paglipat mula sa isang limitadong isang beses na pagsubok, na ginagawang ang plano sa isang matagal na mapagkukunan ng malikhaing sa halip na isang simpleng demo.