Shutterstock a dévoilé un modèle de licence éthique conçu pour remodeler la manière dont les développeurs d’IA accèdent à des données de formation de haute qualité.

La nouvelle licence de recherche Shutterstock permet aux startups d’IA et aux petits développeurs de former des systèmes d’IA de manière abordable et responsable. Sa première application alimente LTXV (LTX Video), un modèle de génération vidéo en temps réel développé par Lightricks.

En utilisant la vaste bibliothèque de vidéos HD et 4K de Shutterstock, Lightricks vise à surmonter les obstacles techniques dans la production vidéo IA tout en adhérant aux normes éthiques. Avec une vaste bibliothèque de plus de 800 millions d’images et 55 millions de clips vidéo, Shutterstock sert actuellement environ 4,1 millions de clients actifs

« De nombreuses entreprises et formateurs de modèles ont emprunté la voie du grattage de données non autorisé [au lieu de] faire l’investissement nécessaire pour atteindre la qualité et le niveau de confiance nécessaires. développer des modèles commercialement viables”, a déclaré Daniel Mandell, responsable mondial des licences de données et de l’IA chez Shutterstock.

“Cependant, nous ne pensons pas que l’investissement financier devrait être un obstacle pour ceux qui cherchent à entrer dans cet espace avec une approche éthique.”

Connexe : OpenAI lance Sora AI Video Generator aux abonnés ChatGPT Plus et Pro

Licence de recherche de Shutterstock : un modèle de licence en deux phases

La licence de recherche de Shutterstock introduit un cadre de licence en deux phases visant à répondre aux le coûts prohibitifs associés à la formation en IA. Dans la phase initiale, les développeurs peuvent expérimenter des ensembles de données plus petits à des fins de test et de validation.

Une fois que leurs projets sont prêts à être commercialisés, ils peuvent passer à des licences commerciales complètes. Cette approche flexible est conçue pour réduire les barrières financières à l’entrée pour les startups et les petites organisations.

Mandell a souligné que Shutterstock visait à établir des normes éthiques dans le développement de l’IA et à garantir une rémunération équitable aux créateurs de contenu.

L’un des défis les plus persistants dans la génération de vidéos IA est de maintenir un mouvement fluide et cohérent entre les images, en particulier dans les clips plus longs. L’architecture de LTXV est spécialement conçue pour résoudre ce problème. En s’entraînant sur les ensembles de données vidéo diversifiés et de haute qualité de Shutterstock, LTXV atteint un niveau de cohérence de mouvement qui le distingue des modèles concurrents.

“Les données de Shutterstock nous permettent de former des modèles de manière responsable et éthique”, a déclaré Zeev Farbman. , PDG de Lightricks.”Ce partenariat garantit que nous respectons les droits de création tout en faisant progresser les capacités techniques de nos outils.”

Connexe : Meta présente le cadre Video Seal pour Filigranes vidéo IA cachés

Rémunération équitable pour les contributeurs

Les contributeurs à la plateforme Shutterstock bénéficient d’un modèle de partage des revenus, recevant 20 % des revenus générés par les données. accords de licence. De plus, les créateurs de contenu peuvent refuser que leur travail soit utilisé à des fins de formation en IA, un choix exercé par moins de 1 % des contributeurs de Shutterstock.

Mandell attribue ce faible taux de refus à la transparence et à l’équité du modèle de licence.

L’initiative positionne Shutterstock comme un moteur de la promotion de pratiques éthiques d’IA à une époque où l’industrie fait l’objet d’une surveillance croissante en matière d’approvisionnement en données. Plusieurs poursuites ont été intentées contre des sociétés d’IA accusées d’utiliser du matériel protégé par le droit d’auteur dans leurs ensembles de données de formation sans autorisation.

Connexe : Amazon dévoile de nouveaux modèles d’IA multimodaux pour le texte, l’image et la vidéo

Capacités de LTXV : génération vidéo d’IA en temps réel

LTXV, développé par Lightricks, peut produire des vidéos plus rapidement que la vitesse de lecture, générant 24 images par seconde et livrer des vidéos haute résolution en seulement 30 secondes sur du matériel haut de gamme.

LTXV offre plusieurs modes de fonctionnement, y compris la génération de texte en vidéo, d’image en vidéo et de vidéo en vidéo. Ces fonctionnalités permettent aux créateurs de générer des animations, de transformer des séquences existantes ou de créer des vidéos entièrement nouvelles basées sur des invites descriptives. La flexibilité de ces outils rend LTXV accessible aussi bien aux cinéastes professionnels qu’aux créateurs indépendants.

Image : lightricks/LTXV

Innovations techniques

Le modèle est construit sur une architecture de transformateur de diffusion (DiT) avec deux milliards de paramètres, ce qui lui permet d’obtenir des transitions fluides entre les images et de maintenir la cohérence sur des clips étendus.

La résolution de sortie par défaut du LTXV est de 768×512, mais elle peut atteindre 720×1280 tout en conservant les performances. Contrairement à de nombreux modèles d’IA, qui nécessitent une infrastructure puissante, LTXV peut fonctionner efficacement sur des GPU grand public avec seulement 6 Go de VRAM, élargissant ainsi son accessibilité aux petits studios et aux développeurs individuels.

Connexe : Google Vertex AI propose désormais le générateur vidéo Veo AI et le modèle texte-image Imagen 3

Craig Andrews, responsable mondial des relations publiques chez Lightricks, a déclaré que la cohérence des mouvements était l’un des plus grands défis techniques de l’IA. vidéo génération et a expliqué que la vidéothèque de Shutterstock a joué un rôle essentiel dans la résolution de ce problème.

Image : lightricks/LTXV

LTXV est publié sous Apache 2.0 licence, le rendant librement disponible pour modification, utilisation et redistribution. Ce framework open source encourage la collaboration entre développeurs et chercheurs tout en garantissant l’accessibilité aux créateurs indépendants et aux petites entreprises. Le modèle est hébergé sur GitHub et Hugging Face, où il a déjà été téléchargé des milliers de fois.

En plus de sa disponibilité open source, LTXV s’intègre à des plateformes comme ComfyUI, permettant aux utilisateurs de personnaliser et d’adapter ses fonctionnalités à des besoins spécifiques. Ce niveau de flexibilité fait de LTXV un outil précieux à la fois pour les experts techniques et les professionnels de la création.

Connexe : Adobe dévoile les outils vidéo IA dans Premiere Pro et étend Firefly

La capacité de LTXV à générer des clips étendus avec une qualité constante le rend hautement évolutif pour diverses applications. Du commerce électronique interactif et de la publicité au développement de jeux et à la création de contenu, la polyvalence du modèle ouvre de nouvelles possibilités aux créateurs. Sa compatibilité avec les GPU grand public élargit encore son attrait, garantissant que même les petits studios peuvent exploiter ses capacités.

Le cadre de licence de Shutterstock offre une alternative conforme qui profite à la fois aux développeurs et aux créateurs de contenu. En exploitant les ensembles de données de Shutterstock provenant de sources éthiques, LTXV illustre comment l’innovation open source peut s’aligner sur les pratiques éthiques.

Categories: IT Info