OpenAI ha lanciato ufficialmente Sora, il suo strumento avanzato di intelligenza artificiale per generare video da istruzioni di testo, segnalando una nuova era per l’intelligenza artificiale creativa. Integrato negli account ChatGPT a pagamento, Sora consente agli utenti di animare immagini fisse, estendere video esistenti e unire scene in narrazioni coerenti.
Lo strumento, ora disponibile a livello globale con alcune eccezioni regionali, rappresenta la spinta di OpenAI nello spazio competitivo della generazione di video AI.
Sam Altman ha sottolineato durante l’evento di lancio che Sora bilancia le possibilità creative con una solida garanzie.
[contenuto incorporato]
Combina innovazione e usabilità dell’intelligenza artificiale
Sora si basa sui modelli esistenti di OpenAI, utilizzando la modellazione della diffusione, una tecnica in cui il rumore viene gradualmente rimosso dagli input casuali per generare video raffinati. Gli utenti possono creare video ad alta definizione di 20 secondi in 1080p, con proporzioni personalizzabili come widescreen, verticale e quadrato.
La versione lanciata oggi, denominata Sora Turbo, offre funzionalità avanzate per la generazione di video. Gli utenti possono creare clip che vanno da 5 a 22 secondi in una varietà di proporzioni, tra cui widescreen, verticale e quadrato. Le risoluzioni disponibili includono 480p, 720p e 1080p, soddisfacendo le diverse esigenze di contenuti.
Per gestire l’utilizzo, OpenAI ha implementato un sistema basato su crediti:
Utenti ChatGPT Plus ricevi 1.000 crediti al mese, supportando fino a 50 video prioritari a 720p e 5 secondi di durata. Agli utenti ChatGPT Pro vengono assegnati 10.000 crediti al mese, consentendo fino a 500 video prioritari a 1080p e 20 secondi. Gli utenti Pro beneficiano anche di video”rilassati”illimitati: output a bassa priorità senza filigrane.
Se utilizzi Re-cut, Remix, Blend o Loop per creare contenuti che non rientra negli incrementi di 5 secondi, i crediti verranno spesi come segue:
Le filigrane sono incluse per impostazione predefinita ma possono essere rimosse per i video rilassati generati dagli utenti Pro. Il sistema di OpenAI reimposta automaticamente i crediti ogni mese , senza rollover per i crediti inutilizzati.
Le funzionalità uniche includono uno strumento storyboard per regolazioni precise fotogramma per fotogramma e un’opzione”Blend”per transizioni fluide tra le scene. Questi strumenti si rivolgono a creatori che vanno dagli utenti occasionali ai registi professionisti.
Il modello integra anche la ricapitolazione, derivata da DALL·E, che gli consente di seguire le istruzioni di testo con eccezionale precisione. Combinando queste funzionalità, OpenAI mira a fornire una piattaforma versatile e facile da usare per lo storytelling.
Sicurezza e moderazione al centro
Per affrontare le preoccupazioni etiche , Sora include molteplici meccanismi di sicurezza. Ogni video generato contiene metadati tramite lo standard C2PA, garantendo trasparenza sulla sua origine AI. Le filigrane visibili sono abilitate per impostazione predefinita, mentre sofisticati classificatori bloccano contenuti espliciti o dannosi.
Il processo di red-teaming di OpenAI, che copre 15.000 scenari di test, ha contribuito a perfezionare i protocolli di moderazione. Ciò includeva il blocco delle richieste contraddittorie progettate per eludere le garanzie. I primi tester hanno identificato le vulnerabilità nella generazione di contenuti con temi complessi come la violenza o l’uso improprio delle somiglianze, portando ad aggiornamenti significativi prima del rilascio pubblico dello strumento.
“Il nostro obiettivo è garantire che Sora venga utilizzato in modo responsabile dando potere ai creatori di tutto il mondo,”OpenAI ha dichiarato in un comunicato.
Leak dell’API di Sora e questioni etiche
Il lancio di Sora segue una controversa fuga di API avvenuta a novembre, quando un gruppo di i primi tester hanno caricato l’API dello strumento su Hugging Face, garantendo l’accesso pubblico alla versione sperimentale. I tester hanno accusato OpenAI di sfruttare manodopera non retribuita e di imporre condizioni eccessivamente restrittive durante il programma di accesso anticipato.
In una dichiarazione che accompagna la fuga di notizie. , il gruppo ha scritto:”Centinaia di artisti forniscono lavoro non retribuito attraverso test di bug, feedback e lavoro sperimentale per il programma per un’azienda valutata 150 miliardi di dollari. Questo programma di accesso anticipato sembra riguardare meno l’espressione creativa e la critica, e più PR e.”
Hanno anche criticato OpenAI per aver richiesto la pre-approvazione per la condivisione di contenuti generati da Sora, definendo le restrizioni”soffocanti”.
OpenAI ha risposto alla reazione negativa, sottolineando la volontarietà natura della partecipazione.”La partecipazione è volontaria, senza obbligo di fornire feedback o utilizzare lo strumento”, ha affermato un portavoce dell’azienda.”Siamo entusiasti di offrire a questi artisti l’accesso gratuito e continueremo a sostenerli attraverso sovvenzioni, eventi e altri programmi.”
Lo sviluppo di Sora ha dovuto affrontare ostacoli significativi, dalle limitazioni tecniche ai cambiamenti organizzativi. Le prime versioni dello strumento richiedevano più di 10 minuti per generare un singolo minuto di video, riflettendo le esigenze computazionali della generazione di video AI.
OpenAI ha risolto questo problema con l’introduzione di Sora Turbo, che ha migliorato i tempi di elaborazione e la qualità dell’output.
Il panorama competitivo nella generazione di video AI
Il lancio di Sora pone OpenAI in concorrenza diretta con i principali attori nel mercato della generazione di video AI, ognuno dei quali offre funzionalità uniche e approcci:
Modello video Adobe Firefly: integrato in Premiere Pro, Firefly consente agli utenti di generare ed estendere video da testo e immagini. L’approccio etico di Adobe, inclusi modelli di formazione su set di dati concessi in licenza e incorporamento di credenziali di contenuto, ha stabilito un punto di riferimento in termini di trasparenza.
Gen-3 Alpha Turbo di Runway ML: noto per la sua velocità e qualità, questo strumento offre output video sette volte più veloce del suo predecessore, con una crescente adozione nel settore dell’intrattenimento attraverso partnership come Lionsgate.
Generatore AI di Google Veo: ancora in fase di sviluppo, Veo promette funzionalità simili a Sora ma deve ancora rilasciare una versione versione pubblica.
Anche alternative open source come Pyramid Flow competono per quote di mercato, offrendo agli sviluppatori flessibilità e output ad alta risoluzione senza costi di licenza.
Nonostante le controversie, Sora rappresenta un’importante fare un passo avanti nella creazione di video basati sull’intelligenza artificiale. OpenAI ha sottolineato il suo impegno nel perfezionare lo strumento attraverso l’implementazione graduale e il feedback degli utenti.
Funzionalità come i metadati C2PA e le filigrane visibili mirano ad affrontare le preoccupazioni relative ai deepfake e all’uso improprio della somiglianza, garantendo trasparenza e sicurezza.
Ultimo aggiornamento l’11 dicembre 2024 10:07 CET