Google har släppt Veo 3.1, en betydande uppdatering av sin AI-videogenereringsmodell som förbättrar kreativ kontroll och realism för kreatörer. Den nya versionen rullas ut till Googles AI-filmskapande verktyg, Flow, och introducerar mer detaljerade redigeringsmöjligheter.
Användare kan nu lägga till objekt till en scen och dra nytta av rikare, synkroniserat ljud i alla Flows avancerade funktioner. Uppdateringen, som också förbättrar snabb efterlevnad och visuell kvalitet, görs tillgänglig i Flow-redigeraren, Gemini-appen och via Gemini API för utvecklare.
Detta drag signalerar Googles avsikt att göra sina generativa verktyg mer kraftfulla och intuitiva. Sedan Flow lanserades i maj har användare skapat över 275 miljoner videor, vilket tyder på en stark efterfrågan på tillgänglig AI-video. Releasen ses som ett direkt konkurrenskraftigt drag mot OpenAI:s Sora 2.
Mer detaljerad kreativ kontroll kommer i flöde
I sitt tillkännagivande formulerade Google uppdateringen som ett direkt svar på feedback från kreatörer för mer sofistikerade verktyg efter generationen.
Enligt produktledarna Jess Gallegos och Thomas Iljic,”vi hörde din feedback och lyssnade alltid på din feedback och vi lyssnade alltid du vill ha mer konstnärlig kontroll inom Flow, med ökat stöd för ljud över alla funktioner.”
Detta fokus på användardriven iteration markerar ett strategiskt skifte som flyttar Flow från en ren generationsmotor till en mer omfattande och interaktiv kreativ svit.
Hjälppunkten i denna satsning är en svit av nya redigeringsverktyg inom Flow-redigeraren.
[inbäddat innehåll]
Det mesta Anmärkningsvärt tillägg är en”Infoga”-funktion, som ger skapare möjlighet att lägga till nya element – från subtila, realistiska detaljer till helt fantastiska varelser – till ett redan genererat videoklipp.
Den är konstruerad för att ge användarna kraften att ombilda och perfektionera sina scener direkt i applikationen, vilket minskar behovet av externa redigeringsprogram och tillägg till Google för mindre,
. modellens sofistikerade säkerställer att dessa tillägg verkar naturliga och kontextuellt lämpliga. Veo 3.1 analyserar den befintliga scenen intelligent för att hantera komplexa detaljer som skuggor och omgivande ljus, vilket säkerställer att det nya objektet är jordat i miljön.
Dessutom arbetar modellen för att blanda in det infogade elementet i klippets etablerade konstnärliga stil. Denna förmåga går bortom enkel objektplacering och erbjuder ett mer dynamiskt och sammanhängande sätt att förfina AI-genererat innehåll.
Som komplement till denna nya funktion meddelade Google också att en motsvarande”Ta bort”-funktion”kommer snart”till Flow-redigeraren.
Det kommer att tillåta användare att sömlöst ta oönskade objekt ur en scen eller karaktär. Företaget förklarade att Flow automatiskt kommer att rekonstruera bakgrunden och omgivningen, vilket får det att se ut som om objektet aldrig fanns där.
Tillsammans representerar dessa funktioner ett betydande steg mot att tillhandahålla en komplett verktygssats för in-painting och out-painting för AI-video.
Från Silent Clips till Rich Audio Storytelling, är fokus för utgåvan av
1:1 i Veo3. ljud förmågor. Uppdateringen bygger på grunden för Veo 3, som var den första Google-modellen som integrerade ljud, och ger nu ljudgenerering till Flows mest avancerade kreativa funktioner.
Denna förbättring åtgärdar en viktig begränsning av tidigare AI-videoverktyg. Som Google DeepMinds vd Demis Hassabis tidigare förklarade,”vi kommer från den tysta eran av videogenerering.”Den här uppdateringen är ett viktigt steg i att uppfylla den visionen, lägga till dialog, ljudeffekter och omgivningsbrus.
Dess fokus på realism är avgörande för att producera trovärdigt och engagerande innehåll utan omfattande efterproduktionsarbete.
Kreatörer kan nu generera ett rikt, synkroniserat ljud när de använder funktioner som”Ingredienser som refererar till bilder för att styra vilka karaktärer och stilar som används för video.”Verktyget”Frames to Video”, för att skapa övergångar mellan två bilder, inkluderar nu även ljud.
[inbäddat innehåll]
Funktionen”Extend”, som används för att skapa längre, kontinuerliga bilder, kommer nu också att generera tillhörande ljudlandskap, vilket gör den mer användbar för att skapa bilder och längre berättande sekvenser.
A Strategic Race/A
Google distribuerar Veo 3.1 i hela sin AI-produktsvit för att maximera räckvidden. Utöver den konsumentinriktade Flow-redigeraren och Gemini-appen är modellen nu tillgänglig för utvecklare och företagskunder.
Utvecklare kan komma åt Veo 3.1 och dess nya funktioner genom en betald förhandsvisning i Gemini API, vilket gör att de kan integrera de kraftfulla videogenereringsfunktionerna i sina egna applikationer. Företagskunder kan dra nytta av modellen genom Vertex AI.
Denna mångsidiga distributionsstrategi visar Googles ambition att konkurrera inom det snabbt växande området AI video. Releasen kommer kort efter den kontroversiella lanseringen av OpenAI:s Sora 2-app, som fick omedelbar motreaktion på grund av upphovsrätt och djupfalska problem.
Däremot fortsätter Google att betona sitt engagemang för ansvarsfull AI, genom att bädda in sin SynthID-vattenstämpel i allt genererat innehåll. Den här strategin verkar vara beräknad att positionera Veo som ett mer stabilt och företagsanpassat alternativ.
Uppdateringen förstärker också Googles förtydligade prenumerationsstrategi i två nivåer, vilket ger ett påtagligt värde till sina AI Pro-och AI Ultra-planer för att uppmuntra adoption och bygga en lojal användarbas.
Shaping the Future of AIShaping the Future of AI generativa videoverktyg förväntas förändra kreativa industrier. Införandet av finkorniga redigeringskontroller och integrerat ljud i Veo 3.1 sänker den tekniska barriären för högkvalitativ videoproduktion, vilket gör det möjligt för berättare att iterera på idéer snabbare.
När dessa plattformar mognar blir de mindre av en nyhet och mer av en integrerad del av det kreativa arbetsflödet till den slutliga produktionen. Fokus skiftar från enkel text-till-video-utgång till en mer interaktiv och samarbetsprocess mellan den mänskliga skaparen och AI-modellen.
Google distribuerar Veo 3.1 i hela sin AI-produktsvit för att maximera räckvidden. Utöver den konsumentinriktade Flow-redigeraren och Gemini-appen är modellen nu tillgänglig för utvecklare och företagskunder.
Utvecklare kan komma åt Veo 3.1 och dess nya funktioner genom en betald förhandsvisning i Gemini API, vilket gör att de kan integrera de kraftfulla videogenereringsfunktionerna i sina egna applikationer. Företagskunder kan dra nytta av modellen genom Vertex AI.
Denna mångsidiga distributionsstrategi visar Googles ambition att konkurrera inom det snabbt växande området AI video. Releasen kommer kort efter den kontroversiella lanseringen av OpenAI:s Sora 2-app, som fick omedelbar motreaktion på grund av upphovsrätt och djupfalska problem.
Däremot fortsätter Google att betona sitt engagemang för ansvarsfull AI, genom att bädda in sin SynthID-vattenstämpel i allt genererat innehåll. Den här strategin verkar vara beräknad att positionera Veo som ett mer stabilt och företagsanpassat alternativ.
Uppdateringen förstärker också Googles förtydligade prenumerationsstrategi i två nivåer, vilket ger ett påtagligt värde till sina AI Pro-och AI Ultra-planer för att uppmuntra adoption och bygga en lojal användarbas.