Google sta espandendo l’accesso a Veo, il suo modello avanzato di generazione video AI, rendendolo disponibile a clienti aziendali selezionati tramite Vertex AI. Questa mossa posiziona Google in prima linea nei video AI generativi, mentre concorrenti come OpenAI devono affrontare sfide crescenti.
Veo offre video AI ad alta definizione per le aziende
Presentato all’inizio di quest’anno al Google I/O, Veo è un generatore video all’avanguardia in grado di creare video 1080p a 24 o 30 fotogrammi al secondo. Grazie alla sua capacità di riprodurre stili cinematografici come timelapse e riprese aeree, Veo consente alle aziende di produrre contenuti dinamici con semplici istruzioni di testo o immagini.
[contenuto incorporato]
“Veo offre un’esperienza senza precedenti livello di controllo creativo e comprende termini cinematografici come”timelapse”o”riprese aeree di un paesaggio”, ha osservato Google nel suo annuncio di maggio.
I clienti aziendali possono ora accedere allo strumento in privato in anteprima, sfruttandolo per semplificare i flussi di lavoro nei settori del marketing, dell’intrattenimento e dei social media.
YouTube Shorts sta inoltre integrando Veo, consentendo ai creatori di generare clip di sei secondi e sfondi video animati a partire da quest’anno, con piena funzionalità prevista entro il 2025.
Veo incorpora SynthID, una tecnologia di watermarking sviluppata da Google DeepMind SynthID incorpora marcatori invisibili nei video generati dall’intelligenza artificiale, garantendo l’autenticità e affrontando le preoccupazioni sulla disinformazione e sul copyright. Questa funzionalità integra le applicazioni aziendali di Veo, offrendo alle aziende la fiducia nell’integrità dei propri contenuti.
[contenuto incorporato]
Immagine 3 su Vertex AI
La piattaforma Vertex AI di Google include anche Imagen 3, un generatore di testo in immagine all’avanguardia che recentemente è diventato disponibile al pubblico. Imagen 3 produce immagini altamente realistiche con un’eccezionale attenzione ai dettagli, come texture fini ed effetti di luce, in base a suggerimenti di conversazione.
Include funzionalità di modifica avanzate come l’inpainting e l’outpainting, che consentono agli utenti di modificare o espandere le parti di un’immagine descrivendo le modifiche desiderate. Il modello offre anche opzioni di personalizzazione per il branding, consentendo alle aziende di generare immagini in linea con stili o loghi specifici.
Correlato: Amazon Ads presenta AI Audio e Creative Studio for Advertisers
p>
Il leak di Sora di OpenAI evidenzia le sfide del settore
Mentre Google migliora le sue capacità di intelligenza artificiale video, OpenAI si trova ad affrontare una reazione negativa dopo il rilascio non autorizzato della sua API Sora su Hugging Face. Sora, progettato per generare video iperrealistici di 10 secondi, era inizialmente disponibile solo per un gruppo ristretto di tester. Tuttavia, i partecipanti hanno accusato OpenAI di sfruttare manodopera non retribuita e di imporre restrizioni eccessive al loro lavoro.
“Questo programma di accesso anticipato sembra essere meno incentrato sull’espressione creativa e sulla critica, e più sulle pubbliche relazioni e”, hanno affermato i tester in dopo l’annuncio trapelato hanno criticato le politiche di OpenAI, che richiedevano l’approvazione dell’azienda per qualsiasi output condiviso, limitando la loro capacità di mostrare il lavoro.
Gli ostacoli tecnici di Sora aggravavano queste frustrazioni minuti per generare un singolo minuto di video, riflettendo richieste computazionali significative. Sebbene OpenAI abbia sviluppato una”variante turbo”più veloce, Sora non è disponibile al pubblico.
Il Chief Product Officer di OpenAI Kevin Weil ha spiegato durante un AMA su Reddit: “La scalabilità dell’infrastruttura informatica e la risoluzione dei rischi di impersonificazione sono state le nostre massime priorità. Si tratta di sfide complesse, ma ci impegniamo a risolverle prima di un rilascio più ampio.”
Correlato: Alibaba, MiniMax, sostenuta da Tencent, lancia AI Video Generator
Pressione competitiva da parte di Adobe, Runway ML e Open Source
Il panorama dell’intelligenza artificiale generativa sta diventando sempre più competitivo, con aziende come Adobe e Runway ML che ampliano i confini nella produzione video:
Questi sviluppi lo dimostrano l’urgenza per Google e OpenAI di affrontare sfide sia tecniche che etiche per rimanere competitivi.
Correlato: Stability AI presenta Stable Video 4D per la generazione video avanzata
Considerazioni etiche negli strumenti video per l’intelligenza artificiale
La fuga di notizie di Sora ha scatenato rinnovate discussioni sull’etica nello sviluppo dell’intelligenza artificiale. I critici sostengono che il modello di collaborazione restrittivo di OpenAI e la dipendenza da tester non retribuiti contrastano in linea con l’attenzione di Google sull’autenticità dei contenuti e sull’uso da parte di Adobe dei dati di formazione concessi in licenza.
La filigrana invisibile di SynthID offre un chiaro vantaggio nell’affrontare la disinformazione e garantire la tracciabilità dei contenuti, mentre le credenziali dei contenuti di Adobe stabiliscono uno standard per la responsabilità nei contenuti generati dall’intelligenza artificiale. media. Questi strumenti riflettono sforzi più ampi per stabilire fiducia e trasparenza in un campo in rapida evoluzione.
Mentre Google espande l’accesso a Veo, il suo approccio evidenzia l’importanza di combinare l’innovazione con le tutele etiche. Rispondendo alle esigenze sia delle aziende che dei singoli creatori, l’azienda sembra posizionarsi bene come leader nella prossima generazione di produzione video basata sull’intelligenza artificiale.