OpenAI a lansat oficial Sora, instrumentul său avansat de inteligență artificială pentru generarea de videoclipuri din mesaje text, semnalând o nouă eră pentru inteligența artificială creativă. Integrat în conturile ChatGPT plătite, Sora permite utilizatorilor să anime imagini statice, să extindă videoclipurile existente și să îmbine scenele în narațiuni coezive.
Instrumentul, acum disponibil la nivel global, cu anumite excepții regionale, reprezintă impulsul OpenAI în spațiul competitiv de generare de videoclipuri AI.
Sam Altman a subliniat în timpul evenimentului de lansare că Sora echilibrează posibilitățile creative cu garanții solide.
[conținut încorporat]
Combinarea inovației AI și a utilizabilității
Sora se bazează pe modelele existente OpenAI, utilizând modelarea difuziei-o tehnică în care zgomotul este eliminat treptat din intrările aleatorii pentru a genera videoclipuri rafinate. Utilizatorii pot crea videoclipuri de înaltă definiție de 20 de secunde în 1080p, cu rapoarte de aspect personalizabile, cum ar fi ecran lat, vertical și pătrat.
Versiunea lansată astăzi, numită Sora Turbo, oferă funcții avansate pentru generarea video. Utilizatorii pot crea clipuri de la 5 la 22 de secunde într-o varietate de raporturi de aspect, inclusiv ecran lat, vertical și pătrat. Rezoluțiile disponibile includ 480p, 720p și 1080p, care răspund nevoilor diverse de conținut.
Pentru a gestiona utilizarea, OpenAI a implementat un sistem bazat pe credit:
utilizatori ChatGPT Plus primiți 1.000 de credite pe lună, care acceptă până la 50 de videoclipuri prioritare la 720p și o durată de 5 secunde. Utilizatorilor ChatGPT Pro li se aloca 10.000 de credite lunar, permițând până la 500 de videoclipuri prioritare la 1080p și 20 de secunde. Utilizatorii profesioniști beneficiază, de asemenea, de videoclipuri „relaxate” nelimitate – rezultate cu prioritate scăzută fără filigrane.
Dacă utilizați Re-cut, Remix, Blend, sau Buclă pentru a crea conținut care nu se încadrează în incrementele de 5 secunde, creditele vor fi cheltuite după cum urmează:
Fiigranele sunt incluse în mod prestabilit, dar pot fi eliminate pentru videoclipurile relaxate generate de sistemul OpenAI resetează automat creditele în fiecare lună, fără transfer pentru creditele neutilizate.
Funcțiile unice includ un instrument de scenariu pentru ajustări precise cadru cu cadru și un Opțiunea „Amestecare” pentru tranziții fără întreruperi între scene. Aceste instrumente se adresează creatorilor, de la utilizatori ocazionali la cineaști profesioniști.
Modelul integrează și recaptionarea, derivată din DALL·E, care îi permite să urmeze instrucțiunile textului cu o acuratețe excepțională. Combinând aceste capabilități, OpenAI își propune să ofere o platformă versatilă și ușor de utilizat pentru povestirea.
Siguranța și moderarea la bază
Pentru a aborda preocupările etice , Sora include multiple mecanisme de siguranță. Fiecare videoclip generat conține metadate prin standardul C2PA, asigurând transparența despre originea sa AI. Filigranele vizibile sunt activate în mod prestabilit, în timp ce clasificatorii sofisticați blochează conținutul explicit sau dăunător.
Procesul de echipă roșie al OpenAI, care acoperă 15.000 de scenarii de testare, a ajutat la rafinarea protocoalelor de moderare. Aceasta a inclus blocarea solicitărilor adverse concepute pentru a sustrage garanțiile. Primii testeri au identificat vulnerabilități în generarea de conținut cu teme complexe, cum ar fi violența sau utilizarea greșită a asemănărilor, ceea ce a condus la actualizări semnificative înainte de lansarea publică a instrumentului.
„Accentul nostru este să ne asigurăm că Sora este utilizată în mod responsabil, în timp ce dăm putere creatorilor din întreaga lume.” OpenAI a declarat într-o declarație.
Scurgerile API-ului Sora și întrebări etice
Lansarea Sora urmează un Scurgere controversată de API în noiembrie, când un grup de testeri timpurii au încărcat API-ul instrumentului pe Hugging Face, acordând acces public la versiunea experimentală. Testerii au acuzat OpenAI că exploatează forța de muncă neremunerată și impune condiții prea restrictive în timpul programului de acces anticipat.
Într-o declarație care însoțește scurgerea, grupul a scris: „Sute de artiști oferă muncă neremunerată prin testarea erorilor, feedback și muncă experimentală pentru programul pentru un Companie apreciată în valoare de 150 de miliarde de dolari. Acest program de acces timpuriu pare să fie mai puțin despre exprimarea creativă și critică, și mai mult despre PR și.”
Au criticat, de asemenea, OpenAI pentru că a solicitat aprobarea prealabilă pentru partajarea conținutului generat de Sora. restricțiile „înăbușitoare”.
OpenAI a răspuns reacției, subliniind caracterul voluntar al participării. „Participarea este voluntară, fără obligația de a oferi feedback sau de a folosi instrumentul”, a spus un purtător de cuvânt al companiei. „Am fost încântați să oferim acestor artiști acces gratuit și vom continua să îi sprijinim prin granturi, evenimente și alte programe.”
Dezvoltarea Sorei s-a confruntat cu obstacole semnificative, de la limitări tehnice până la schimbări organizaționale. Versiunile inițiale ale instrumentului au necesitat peste 10 minute pentru a genera un singur minut de videoclip, reflectând cerințele de calcul ale generării video AI.
OpenAI a abordat acest lucru prin introducerea Sora Turbo, care a îmbunătățit timpii de procesare și calitatea ieșirii..
Peisajul competitiv în generarea video AI
Lansarea Sorei plasează OpenAI în concurență directă cu jucătorii de top din videoclipul AI generație, fiecare oferind capabilități și abordări unice:
Model video Adobe Firefly: integrat în Premiere Pro, Firefly le permite utilizatorilor să genereze și să extindă videoclipuri din text și imagini. Abordarea etică a Adobe, inclusiv modele de instruire pentru seturi de date licențiate și încorporarea acreditărilor de conținut, a stabilit un etalon pentru transparență.
Gen-3 Alpha Turbo de la Runway ML: Cunoscut pentru viteza și calitatea sa, acest instrument oferă șapte ieșiri video. de ori mai rapid decât predecesorul său, cu o adoptare tot mai mare în industria divertismentului prin parteneriate precum Lionsgate.
Google Veo AI Generator: Încă în dezvoltare, Veo promite capabilități similare cu Sora, dar nu a lansat încă o versiune publică.
Alternativele open-source precum Pyramid Flow concurează și pentru cota de piață, oferind dezvoltatorilor flexibilitate și rezultate de înaltă rezoluție fără taxe de licență..
În ciuda controverselor, Sora reprezintă un pas semnificativ înainte în crearea video bazată pe inteligență artificială. OpenAI și-a subliniat angajamentul de a perfecționa instrumentul prin implementare treptată și feedback de la utilizatori.
Funcții precum metadatele C2PA și filigranele vizibile au scopul de a aborda preocupările legate de deepfakes și utilizarea greșită a asemănării, asigurând transparența și siguranța.
Ultima actualizare pe 11 decembrie 2024 10:07 CET