OpenAI a lancé Sora 2, son nouveau modèle d’IA puissant qui génère une vidéo avec un audio synchronisé, aux côtés d’une nouvelle application de médias sociaux pour iOS. Également appelée Sora, l’application a été publiée mardi et propose un flux de style Tiktok pour partager des clips générés par AI-AI. Il est actuellement disponible par invitation aux États-Unis et au Canada.

La fonctionnalité «Cameo» signature de l’application permet aux utilisateurs de créer des vidéos avec eux-mêmes et leurs amis, soulevant des questions immédiates sur le consentement et la technologie DeepFake.

Avec cette double version, OpenAI n’est pas simplement la progression de ses capacités AI de base. hauteur=”609″src=”data: image/svg + xml; nitro-empty-id=mty1nzoxmdy1-1; base64, phn2zyb2awv3qm94psiwidagmte5nya2md kiihdpzhropsixmtk3iibozwlnahq9ijywosigeg1sbnm9imh0dha6ly93d3cudzmub3jnlziwmdavc3znij48l3n2zz4=”>

SORA 2: un bond en avant dans la génération vidéo et audio AI

La version de SORA 2 marque un Milestone technique significatif pour la vidéo généative , le modèle comme un nouveau état d’état-de-naire pour la vidéo et l’audio> Création.

En s’appuyant sur son prédécesseur, le nouveau modèle présente une suite de capacités qui ont été notoirement difficiles à maîtriser, y compris un réalisme plus net, une direction des utilisateurs améliorée et une gamme stylistique étendue.

Plus particulièrement, SORA 2 peut désormais générer des modèles de synchronisation à côté de ses clips vidéo, un premier pour les modèles Openai. Le modèle VEO 3 de Google a été le premier à ajouter de telles capacités en mai de cette année. Pour les créateurs, cet audio intégré change la donne.

[Contenu intégré]

Il élimine l’étape de post-production complexe de l’approvisionnement et de l’alignement, abaissant considérablement la barrière à la production de contenu immersif poli. Ce saut déplace une vidéo de l’IA d’une nouveauté technique pour être un outil de production pratique et de bout en bout.

L’annonce d’Openai met également en évidence Major Amélioration de la compréhension réelle/plus réelle.

L’entreprise a expliqué que les systèmes plus anciens souffraient d’un défaut clé, notant que «les modèles vidéo antérieurs sont tropoptimistes-ils transformeront les objets et déformeront la réalité pour exécuter avec succès sur une invite de texte.»

Cela a souvent abouti à des clips où les lois de la cause et de l’effet se sont senties brisées ou incohérentes.

Sora 2, en contraste, est conçue pour être plus fondée dans la dynamique physique. Pour illustrer l’amélioration, OpenAI affirme que «dans Sora 2, si un basketteur manque un coup, il rebondira sur le panneau.»

Cette adhésion à la physique est présentée dans des clips publics représentant des actions complexes comme les jeux de volley-ball de plage et les astuces de skateboard, signalant une étape cruciale vers des modèles qui peuvent simuler plus précisément la complexité de la complexité du monde physique.

L’application Sora: un rival de Tiktok avec une torsion AI

Au-delà du modèle lui-même, la plus grande histoire est le pivot stratégique d’Openai dans .

L’application, actuellement disponible pour les iPhones par invitation uniquement aux États-Unis et au Canada, présente aux utilisateurs un flux familier et à défilement vertical de courtes vidéos.

Mais il a une différence fondamentale: chaque morceau de contenu est uniquement généré dans l’application, avec des créations actuelles limitées à 10 secondes. API, OpenAI fait un jeu stratégique pour une base d’utilisateurs captive. Les employés l’auraient appelé le potentiel «Moment Chatgpt pour la génération de vidéos». Cette approche permet à l’entreprise de contrôler l’expérience utilisateur, de recueillir des commentaires directs et de créer un effet de réseau via un système d’invitation où chaque nouvel utilisateur peut apporter Openai a décrit ses principes principaux Pour le flux de l’application, déclarant son objectif est de”aider les gens à apprendre ce qui est possible, et d’inspirer. L’algorithme est conçu pour «favoriser la créativité et la participation active, pas le défilement passif». Pour favoriser la communauté, le système privilégie également le «contenu connecté» d’amis sur des vidéos globales et non connectées

Le flux est personnalisé à l’aide de signaux comme les messages, les goûts et les comptes suivis de l’utilisateur, ainsi que leur historique Chatgpt, bien que cela puisse être désactivé dans les paramètres de l’application.

Sous-sweat a Focus sur le contrôle de l’utilisateur, la plate-forme comprend également un réglage Steal Personnalisation et défilement continu pour les comptes adolescents.

Cela crée un écosystème créatif fermé où la consommation et la création sont étroitement liées. L’application encourage la participation via une fonctionnalité”Remix”, permettant aux utilisateurs de s’appuyer sur des vidéos et des concepts tendance-un mécanicien a prouvé très réussi sur des plateformes comme Tiktok.

Naviguer dans le dilemme Deepfake avec”Cameos”et Consent

au cœur de l’application Sora est”leur propre ressemblance aux vidéos générées. Pour créer un camée, un utilisateur doit télécharger un court enregistrement vidéo et audio pour vérifier son identité et capturer son apparence.

Cette fonction apporte immédiatement le problème de DeepFakes et le consentement au premier plan. OpenAI semble avoir anticipé ces préoccupations par en créant un cadre de consentement robuste directement dans l’application .

désigné un «copropriétaire» de la vidéo. Cela leur donne le droit permanent de supprimer le contenu ou de révoquer l’accès, offrant une sauvegarde critique contre une mauvaise utilisation.

Openai a déclaré que”les personnalités publiques ne peuvent pas être générées à Sora à moins qu’ils aient téléchargé un camée eux-mêmes et qu’il avait consentement pour qu’il soit utilisé”, étendant cette protection aux personnalités publiques qui n’ont pas opté pour les médias concurrents. Arena

Avec ce lancement, Openai réchauffe une fois de plus la «course aux armements de l’IA» d’une bataille sur les performances du modèle à une lutte pour l’engagement des consommateurs. La société estime que «nous pensons qu’une application sociale construite autour de cette fonctionnalité« camées »est le meilleur moyen de découvrir la magie de Sora 2», indiquant une stratégie axée sur l’expérience utilisateur sur les démos techniques brutes.

Cette décision met Openai dans une concurrence directe non seulement avec d’autres développeurs vidéo AI comme Google et son modèle VEO 3, mais aussi avec les géants des médias sociaux récent. Outils pour les créateurs, signalant une tendance plus large de l’industrie.

La version se produit également dans un contexte de débat juridique et éthique intense sur les données utilisées pour former ces modèles puissants.

Alors qu’Openai se poursuit avec de nouveaux produits, les questions non résolues entourant les données et le copyright continuent de se moquer de toute l’industrie générale de l’industrie.

Categories: IT Info