Google ha rilasciato Veo 3.1, un aggiornamento significativo del suo modello di generazione di video AI che migliora il controllo creativo e il realismo per i creatori. La nuova versione è in fase di implementazione nello strumento di creazione cinematografica basato sull’intelligenza artificiale di Google, Flow, introducendo funzionalità di editing più granulari.
Gli utenti possono ora aggiungere oggetti a una scena e beneficiare di un audio più ricco e sincronizzato in tutte le funzionalità avanzate di Flow. L’aggiornamento, che migliora anche l’aderenza rapida e la qualità visiva, viene reso disponibile nell’editor Flow, nell’app Gemini e tramite l’API Gemini per sviluppatori.
Questa mossa segnala l’intenzione di Google di rendere i suoi strumenti generativi più potenti e intuitivi. Dal lancio di Flow a maggio, gli utenti hanno creato oltre 275 milioni di video, indicando una forte domanda per la creazione di video accessibili tramite intelligenza artificiale. Il rilascio è visto come una mossa competitiva diretta contro Sora 2 di OpenAI.
Un controllo creativo più granulare arriva in Flow
Nel suo annuncio, Google ha definito l’aggiornamento come una risposta diretta al feedback dei creatori per strumenti di post-generazione più sofisticati.
Secondo i responsabili del prodotto Jess Gallegos e Thomas Iljic,”ascoltiamo sempre il tuo feedback e abbiamo sentito che desideri più controllo artistico all’interno di Flow, con un maggiore supporto per l’audio in tutte le funzionalità.”
Questa attenzione all’iterazione guidata dall’utente segna un cambiamento strategico, spostando Flow da un motore di pura generazione a una suite creativa più completa e interattiva.
Il fulcro di questo sforzo è una suite di nuovi strumenti di modifica all’interno dell’editor di Flow progettati per i momenti in cui la prima ripresa non è quella finale.
[contenuto incorporato]
Il l’aggiunta più notevole è la funzione”Inserisci”, che consente ai creatori di aggiungere nuovi elementi, da dettagli sottili e realistici a creature del tutto fantastiche, in un video clip già generato.
È progettato per dare agli utenti il potere di reimmaginare e perfezionare le proprie scene direttamente all’interno dell’applicazione, riducendo la necessità di software di editing esterno per piccole modifiche e aggiunte.
Secondo Google, il modello la sofisticazione garantisce che queste aggiunte appaiano naturali e contestualmente appropriate. Veo 3.1 analizza in modo intelligente la scena esistente per gestire dettagli complessi come ombre e illuminazione ambientale, garantendo che il nuovo oggetto sia radicato nell’ambiente.
Inoltre, il modello lavora per fondere l’elemento inserito nello stile artistico consolidato della clip. Questa funzionalità va oltre il semplice posizionamento degli oggetti, offrendo un modo più dinamico e coeso per perfezionare i contenuti generati dall’intelligenza artificiale.
A complemento di questa nuova funzionalità, Google ha anche annunciato che una corrispondente funzione”Rimuovi”sarà”disponibile presto”nell’editor di Flow.
Consentirà agli utenti di eliminare senza problemi oggetti o personaggi indesiderati da una scena. L’azienda ha spiegato che Flow ricostruirà automaticamente lo sfondo e l’ambiente circostante, facendo sembrare che l’oggetto non sia mai stato lì.
Insieme, queste funzionalità rappresentano un passo significativo verso la fornitura di un kit completo di strumenti di pittura e pittura per video AI.
Da clip silenziosi a narrazione con audio ricco
Uno degli obiettivi principali della versione Veo 3.1 è l’espansione dell’audio capacità. Basandosi sulle fondamenta di Veo 3, che è stato il primo modello Google a integrare l’audio, l’aggiornamento ora porta la generazione audio nelle funzioni creative più avanzate di Flow.
Questo miglioramento risolve una limitazione chiave dei precedenti strumenti video AI. Come ha dichiarato in precedenza il CEO di Google DeepMind, Demis Hassabis,”stiamo emergendo dall’era silenziosa della generazione di video”. Questo aggiornamento rappresenta un passo significativo verso la realizzazione di questa visione, aggiungendo dialoghi, effetti sonori e rumore ambientale.
L’attenzione al realismo è fondamentale per produrre contenuti credibili e coinvolgenti senza un ampio lavoro di post-produzione.
I creatori possono ora generare audio ricco e sincronizzato quando utilizzano funzionalità come”Ingredients to Video”, che utilizza immagini di riferimento per controllare personaggi e stile. Lo strumento”Frames to Video”, per creare transizioni tra due immagini, ora include anche l’audio.
[contenuto incorporato]
La funzione”Estendi”, utilizzata per creare inquadrature continue e più lunghe, ora genererà anche paesaggi sonori di accompagnamento, rendendola più utile per stabilire inquadrature e sequenze narrative più lunghe.
Un lancio strategico nella gara video AI
Google sta implementando Veo 3.1 nell’intera suite di prodotti IA per massimizzarne la portata. Oltre all’editor Flow rivolto al consumatore e all’app Gemini, il modello è ora disponibile per sviluppatori e clienti aziendali.
Gli sviluppatori possono accedere a Veo 3.1 e alle sue nuove funzionalità tramite un’anteprima a pagamento nell’API Gemini, consentendo loro di integrare le potenti funzionalità di generazione video nelle proprie applicazioni. I clienti aziendali possono sfruttare il modello tramite Vertex AI.
Questa strategia di distribuzione su più fronti mostra l’ambizione di Google di competere nel campo in rapida evoluzione dei video AI. Il rilascio arriva poco dopo il controverso lancio dell’app Sora 2 di OpenAI, che ha subito una reazione immediata a causa di copyright e deepfake.
Al contrario, Google continua a sottolineare il suo impegno verso un’intelligenza artificiale responsabile, incorporando la filigrana SynthID in tutti i contenuti generati. Questa strategia sembra calcolata per posizionare Veo come un’alternativa più stabile e pronta per l’azienda.
L’aggiornamento rafforza inoltre la chiara strategia di abbonamento a due livelli di Google, aggiungendo valore tangibile ai suoi piani AI Pro e AI Ultra per incoraggiare l’adozione e costruire una base di utenti fedeli.
Plasmare il futuro del cinema con intelligenza artificiale
La rapida evoluzione di Si prevede che gli strumenti video generativi trasformeranno le industrie creative. L’introduzione di controlli di editing a grana fine e audio integrato in Veo 3.1 abbassa la barriera tecnica per la produzione video di alta qualità, consentendo agli storyteller di iterare le idee più rapidamente.
Man mano che queste piattaforme maturano, stanno diventando meno una novità e più parte integrante del flusso di lavoro creativo, dallo storyboard alla produzione finale. L’attenzione si sta spostando dal semplice output da testo a video a un processo più interattivo e collaborativo tra il creatore umano e il modello di intelligenza artificiale.