Google har gitt ut Veo 3.1, en betydelig oppdatering av sin AI-videogenerasjonsmodell som forbedrer kreativ kontroll og realisme for skapere. Den nye versjonen rulles ut til Googles AI-filmskapingsverktøy, Flow, og introduserer mer detaljerte redigeringsmuligheter.

Brukere kan nå legge til objekter i en scene og dra nytte av rikere, synkronisert lyd på tvers av alle Flows avanserte funksjoner. Oppdateringen, som også forbedrer umiddelbar overholdelse og visuell kvalitet, gjøres tilgjengelig i Flow-redigeringsprogrammet, Gemini-appen og via Gemini API for utviklere.

Dette trekket signaliserer Googles intensjon om å gjøre sine generative verktøy kraftigere og mer intuitive. Siden Flows lansering i mai har brukere laget over 275 millioner videoer, noe som indikerer stor etterspørsel etter tilgjengelig AI-video. Utgivelsen blir sett på som et direkte konkurransetrekk mot OpenAIs Sora 2.

Mer detaljert kreativ kontroll kommer i gang

I sin kunngjøring utformet Google oppdateringen som et direkte svar på tilbakemeldinger fra skapere for mer sofistikerte post-generasjonsverktøy.

I følge produktlederne Jess Gallegos og Thomas Iljic,”vi lytter alltid til tilbakemeldingene dine, og lytter alltid til tilbakemeldingene dine. og vi har hørt at du vil ha mer kunstnerisk kontroll innenfor Flow, med økt støtte for lyd på tvers av alle funksjoner.”

Dette fokuset på brukerdrevet iterasjon markerer et strategisk skifte som flytter Flow fra en ren generasjonsmotor til en mer omfattende og interaktiv kreativ suite.

Kjernen i denne innsatsen er en pakke med nye redigeringsverktøy når de første som er utformet i det siste øyeblikket. en.

[innebygd innhold]

Det mest bemerkelsesverdige tillegget er en «Sett inn»-funksjon, som gir skapere mulighet til å legge til nye elementer – fra subtile, realistiske detaljer til helt fantastiske skapninger – til et allerede generert videoklipp.

Den er konstruert for å gi brukerne kraften til å gjenoppfatte og perfeksjonere scenene sine direkte i applikasjonen, og redusere behovet for ekstern justering eller tilleggsfunksjoner.

I følge Google sikrer modellens sofistikerte at disse tilleggene fremstår som naturlige og kontekstuelt passende. Veo 3.1 analyserer den eksisterende scenen intelligent for å håndtere komplekse detaljer som skygger og omgivelseslys, og sikrer at det nye objektet er jordet i miljøet.

I tillegg jobber modellen for å blande det innsatte elementet inn i klippets etablerte kunstneriske stil. Denne funksjonen går lenger enn enkel objektplassering, og tilbyr en mer dynamisk og sammenhengende måte å avgrense AI-generert innhold.

Som utfylling av denne nye funksjonen kunngjorde Google også at en tilsvarende”Fjern”-funksjon”kommer snart”til Flow-redigeringsprogrammet.

Den vil tillate brukere å sømløst fjerne uønskede objekter eller karakterer. Selskapet forklarte at Flow automatisk vil rekonstruere bakgrunnen og omgivelsene, slik at det ser ut som om objektet aldri var der.

Sammen representerer disse funksjonene et betydelig skritt mot å tilby et komplett verktøysett for inn-og utmaling for AI-video.

Fra Silent Clips til Rich Audio Storytelling>A3. lydfunksjoner. Oppdateringen bygger på grunnlaget for Veo 3, som var den første Google-modellen som integrerte lyd, og bringer nå lydgenerering til Flows mest avanserte kreative funksjoner.

Denne forbedringen adresserer en viktig begrensning ved tidligere AI-videoverktøy. Som administrerende direktør i Google DeepMind, Demis Hassabis, tidligere erklærte,”vi kommer fra den stille epoken med videogenerering.”Denne oppdateringen er et viktig skritt i å oppfylle denne visjonen, legge til dialog, lydeffekter og omgivelsesstøy.

Dens fokus på realisme er avgjørende for å produsere troverdig og engasjerende innhold uten omfattende etterproduksjonsarbeid.

Skapere kan nå generere rik, synkronisert lyd når de bruker funksjoner som «Ingredienser som refererer til video» for å kontrollere hvilke karakterer og stiler. «Frames to Video»-verktøyet, for å lage overganger mellom to bilder, inkluderer nå også lyd.

[innebygd innhold]

«Extend»-funksjonen, som brukes til å lage lengre, kontinuerlige bilder, vil nå også generere tilhørende lydlandskap, noe som gjør det mer nyttig for å etablere bilder og lengre narrative sekvenser.

A Strategic Race in the Strategih Video/AI

Google implementerer Veo 3.1 på tvers av hele AI-produktpakken for å maksimere rekkevidden. Utover den forbrukervendte Flow-redigereren og Gemini-appen, er modellen nå tilgjengelig for utviklere og bedriftskunder.

Utviklere kan få tilgang til Veo 3.1 og dens nye funksjoner gjennom en betalt forhåndsvisning i Gemini API, slik at de kan integreres de kraftige videogenereringsmulighetene inn i sine egne applikasjoner. Enterprise-klienter kan utnytte modellen gjennom Vertex AI.

Denne flerstrengede distribusjonsstrategien viser Googles ambisjon om å konkurrere i det raskt utviklende feltet innen AI-video. Utgivelsen kommer kort tid etter den kontroversielle lanseringen av OpenAIs Sora 2-app, som møtte umiddelbar tilbakeslag over opphavsrett og dypfalske bekymringer.

Derimot fortsetter Google å understreke sin forpliktelse til ansvarlig AI, ved å bygge inn SynthID-vannmerket i alt generert innhold. Denne strategien ser ut til å være beregnet for å posisjonere Veo som et mer stabilt og bedriftsklar alternativ.

Oppdateringen forsterker også Googles tydelige to-lags abonnementsstrategi, og legger konkret verdi til planene for AI Pro og AI Ultra for å oppmuntre til bruk og bygge en lojal brukerbase.

Shaping the Future of AIThe rapidmaking of AI generative videoverktøy forventes å transformere kreative næringer. Introduksjonen av finkornede redigeringskontroller og integrert lyd i Veo 3.1 senker den tekniske barrieren for videoproduksjon av høy kvalitet, noe som gjør det mulig for historiefortellere å iterere på ideer raskere.

Når disse plattformene modnes, blir de mindre av en nyhet og mer en integrert del av den kreative arbeidsflyten til den endelige produksjonen. Fokuset skifter fra enkel tekst-til-video-utgang til en mer interaktiv og samarbeidende prosess mellom den menneskelige skaperen og AI-modellen.

Categories: IT Info