OpenAI a officiellement lancé Sora, son outil d’IA avancé permettant de générer des vidéos à partir d’invites textuelles, ouvrant ainsi la voie à une nouvelle ère pour l’IA créative. Intégré aux comptes ChatGPT payants, Sora permet aux utilisateurs d’animer des images fixes, d’étendre des vidéos existantes et de fusionner des scènes dans des récits cohérents.
L’outil, maintenant disponible dans le monde entier avec certaines exceptions régionales, représente la poussée d’OpenAI dans l’espace compétitif de génération de vidéos IA.
Sam Altman a souligné lors de l’événement de lancement que Sora équilibre les possibilités créatives avec des fonctionnalités robustes. mesures de protection.
[contenu intégré]
Combiner innovation et convivialité en IA
Sora s’appuie sur les modèles existants d’OpenAI, en employant modélisation de diffusion : une technique dans laquelle le bruit est progressivement supprimé des entrées aléatoires pour générer des vidéos raffinées. Les utilisateurs peuvent créer des vidéos haute définition de 20 secondes en 1080p, avec des formats d’image personnalisables comme écran large, vertical et carré.
La version lancée aujourd’hui, nommée Sora Turbo, offre des fonctionnalités avancées pour la génération vidéo. Les utilisateurs peuvent créer des clips allant de 5 à 22 secondes dans une variété de formats d’image, notamment grand écran, vertical et carré. Les résolutions disponibles incluent 480p, 720p et 1080p, répondant à divers besoins de contenu.
Pour gérer l’utilisation, OpenAI a mis en place un système basé sur les crédits :
Utilisateurs de ChatGPT Plus recevez 1 000 crédits par mois, prenant en charge jusqu’à 50 vidéos prioritaires en 720p et d’une durée de 5 secondes. Les utilisateurs de ChatGPT Pro reçoivent 10 000 crédits par mois, permettant jusqu’à 500 vidéos prioritaires en 1080p et 20 secondes. Les utilisateurs professionnels bénéficient également de vidéos « détendue » illimitées : sorties à faible priorité sans filigrane.
Si vous utilisez Re-cut, Remix, Blend ou Loop pour créer du contenu qui tombe en dehors des incréments de 5 secondes, les crédits seront dépensés comme suit :
Les filigranes sont inclus par défaut mais peuvent être supprimés pour les vidéos détendues générées par les utilisateurs Pro. Le système OpenAI réinitialise automatiquement les crédits chaque mois. sans roulement pour les crédits inutilisés.
Les fonctionnalités uniques incluent un outil de storyboard pour des ajustements précis image par image et une option « Mélange » pour des transitions fluides entre les scènes. Ces outils s’adressent aux créateurs allant des utilisateurs occasionnels aux cinéastes professionnels.
Le modèle intègre également le récapitulatif, dérivé de DALL·E, qui lui permet de suivre les invites textuelles avec une précision exceptionnelle. En combinant ces capacités, OpenAI vise à fournir une plate-forme de narration polyvalente et conviviale.
Sécurité et modération au cœur
Pour répondre aux préoccupations éthiques , Sora comprend plusieurs mécanismes de sécurité. Chaque vidéo générée contient des métadonnées via la standard C2PA, garantissant la transparence sur son origine IA. Les filigranes visibles sont activés par défaut, tandis que les classificateurs sophistiqués bloquent le contenu explicite ou nuisible.
Le processus d’équipe rouge d’OpenAI, couvrant 15 000 scénarios de test, a permis d’affiner les protocoles de modération. Cela comprenait le blocage des invites contradictoires conçues pour échapper aux garanties. Les premiers testeurs ont identifié des vulnérabilités dans la génération de contenu sur des thèmes complexes comme la violence ou l’utilisation abusive de ressemblances, ce qui a conduit à des mises à jour importantes avant la sortie publique de l’outil.
“Notre objectif est de garantir que Sora soit utilisé de manière responsable tout en responsabilisant les créateurs du monde entier.”OpenAI a déclaré dans un communiqué.
La fuite de l’API Sora et les questions éthiques
Le lancement de Sora fait suite à une fuite controversée de l’API en novembre, lorsqu’un groupe de Les premiers testeurs ont téléchargé l’API de l’outil sur Hugging Face, accordant ainsi un accès public à la version expérimentale. Les testeurs ont accusé OpenAI d’exploiter le travail non rémunéré et d’imposer des conditions trop restrictives pendant le programme d’accès anticipé.
Dans une déclaration accompagnant la fuite. , le groupe a écrit: « Des centaines d’artistes fournissent un travail non rémunéré via des tests de bugs, des commentaires et des travaux expérimentaux pour le programme d’une entreprise évaluée à 150 milliards de dollars. Ce programme à accès anticipé semble moins axé sur l’expression créative et la critique, que sur l’expression créative et la critique. PR et.”
Ils ont également critiqué OpenAI pour avoir exigé une approbation préalable pour le partage de contenu généré par Sora, qualifiant les restrictions d'”étouffantes.”
OpenAI a répondu à la réaction négative, en mettant l’accent sur le volontariat. nature de la participation.”La participation est volontaire, sans obligation de fournir des commentaires ou d’utiliser l’outil”, a déclaré un porte-parole de l’entreprise.”Nous sommes ravis d’offrir un accès gratuit à ces artistes et continuerons à les soutenir par le biais de subventions, d’événements et d’autres programmes.”/p>
Le développement de Sora a été confronté à des obstacles importants, allant des limitations techniques aux changements organisationnels. Les premières versions de l’outil nécessitaient plus de 10 minutes pour générer une seule minute de vidéo, ce qui reflète les exigences informatiques de la génération vidéo par l’IA.
OpenAI a résolu ce problème avec l’introduction de Sora Turbo, qui a amélioré les temps de traitement et la qualité de sortie..
Le paysage concurrentiel de la génération vidéo IA
Le lancement de Sora place OpenAI en concurrence directe avec les principaux acteurs du marché de la génération vidéo IA, chacun offrant des capacités uniques. et approches :
Modèle vidéo Adobe Firefly : intégré à Premiere Pro, Firefly permet aux utilisateurs de générer et d’étendre des vidéos à partir de texte et d’images. L’approche éthique d’Adobe, y compris les modèles de formation sur des ensembles de données sous licence et l’intégration des informations d’identification de contenu, a établi une référence en matière de transparence.
Gen-3 Alpha Turbo de Runway ML : connu pour sa vitesse et sa qualité, cet outil fournit sept sorties vidéo. fois plus rapide que son prédécesseur, avec une adoption croissante dans l’industrie du divertissement grâce à des partenariats comme Lionsgate.
Google Veo AI Generator : toujours en développement, Veo promet des fonctionnalités similaires à celles de Sora, mais n’a pas encore publié de version publique. version.
Les alternatives open source comme Pyramid Flow se disputent également des parts de marché, offrant aux développeurs une flexibilité et des sorties haute résolution sans frais de licence.
Malgré les controverses, Sora représente une étape importante en avant dans la création vidéo basée sur l’IA. OpenAI a souligné son engagement à affiner l’outil grâce à un déploiement progressif et aux commentaires des utilisateurs.
Des fonctionnalités telles que les métadonnées C2PA et les filigranes visibles visent à répondre aux préoccupations concernant les deepfakes et l’utilisation abusive de la ressemblance, garantissant ainsi la transparence et la sécurité.
Dernière mise à jour le 11 décembre 2024 à 10h07 CET