Meta a annoncé Meta Video Seal, un nouvel outil open source conçu pour filigraner les vidéos générées par l’IA. Video Seal intègre des filigranes invisibles mais robustes qui persistent lors des modifications, de la compression et du partage, permettant ainsi de tracer et d’authentifier le contenu.
Cette version vise à répondre aux préoccupations croissantes concernant l’utilisation abusive de l’IA générative, y compris la montée des deepfakes et des contenus manipulés.
Le développement de Video Seal intervient à un moment où la prolifération des L’IA générative a introduit de nouveaux défis pour la modération du contenu. La recherche a révélé une multiplication par dix (10x) du nombre de deepfakes détectés à l’échelle mondiale dans tous les secteurs de 2022 à 2023, contribuant à 7 % des cas de fraude mondiaux, allant du vol d’identité à l’ingénierie sociale élaborée.
Avec la sortie cette semaine du générateur vidéo Sora d’OpenAI, ces solutions de filigrane devront jouer un rôle croissant pour aider les humains à distinguer les vidéos générées par l’IA des images réelles.
Le problème du sceau vidéo Résout
La technologie Deepfake, alimentée par des modèles d’IA génératifs tels que DALL·E et Stable Diffusion, a permis la création de contenu hyperréaliste mais trompeur.
Bien que ces outils offrent des possibilités créatives, ils présentent également des risques, tels que la propagation de fausses informations et d’activités frauduleuses. Le tatouage vidéo offre une solution en intégrant des identifiants dans les vidéos pour vérifier leur authenticité.
Les techniques traditionnelles de tatouage vidéo ne parviennent souvent pas à répondre aux défis modernes. Les transformations vidéo telles que le recadrage, la compression et le réencodage peuvent déformer ou supprimer les filigranes, les rendant inefficaces. Video Seal de Meta introduit de nouvelles méthodes pour garantir la résilience contre de telles distorsions.
Comment fonctionne Video Seal
Meta Video Seal utilise des techniques innovantes de filigrane neuronal qui le rendent à la fois efficace et robuste. L’une de ses caractéristiques déterminantes est la propagation temporelle du filigrane, un processus qui intègre un filigrane dans les images vidéo clés et le propage aux images voisines.
Cette approche réduit la charge de calcul tout en garantissant que le filigrane invisible reste intact même après que la vidéo ait subi des transformations courantes.
Image : Meta AI
L’outil exploite également les augmentations différenciables, les transformations appliquées pendant la phase de formation qui simulent des distorsions vidéo réelles, pour simuler des distorsions réelles telles que la compression et le recadrage. Cela garantit la résilience du filigrane dans des conditions difficiles.
L’équipe de recherche de Meta explique,”Video Seal élimine le besoin de filigraner chaque image d’une vidéo en exploitant la propagation temporelle du filigrane, ce qui permet des temps d’inférence rapides tout en conservant la robustesse à la compression vidéo et aux distorsions géométriques.”
Un autre aspect critique est le processus de formation en plusieurs étapes. Video Seal commence par une pré-formation sur l’image, puis passe à une formation spécifique à la vidéo avec des étapes de réglage fin. Cette approche hybride combine l’efficacité des modèles basés sur l’image avec l’adaptabilité nécessaire au contenu vidéo.
Video Seal a été testé par rapport aux références de l’industrie comme MBRS, TrustMark et WAM et ont démontré des performances supérieures sous des transformations telles que la compression H.264 et les distorsions géométriques. Cela en fait l’un des frameworks de filigrane les plus robustes actuellement disponibles.
Pour encourager une collaboration plus poussée, Meta a lancé le Meta Omni Seal. Bench, un classement public permettant de comparer les techniques de tatouage. L’entreprise prévoit également d’organiser un atelier lors de la Conférence internationale sur les représentations de l’apprentissage (ICLR) en 2025 pour favoriser le dialogue au sein des communautés universitaires et industrielles.
« Nous publions publiquement le modèle Video Seal sous une licence permissive, accompagné d’un document de recherche, d’un code de formation et d’un code d’inférence. » Méta-états.
Autres solutions de filigrane IA
Meta n’est pas le seul à s’efforcer de relever les défis posés par l’IA générative. Des concurrents comme DeepMind et Microsoft ont également introduit des outils de filigrane, soulignant la reconnaissance du problème par l’ensemble du secteur.
SynthID de Google DeepMind. , par exemple, utilise des techniques de filigrane neuronal similaires pour les images, vidéos et audio générés par l’IA. Cependant, la nature open source de Video Seal le distingue, permettant aux chercheurs et aux développeurs d’accéder librement à son code et de contribuer à son développement. amélioration.
Meta Video Seal se concentre également exclusivement sur le contenu vidéo, incorporant des filigranes imperceptibles dans des images individuelles et proposant des messages cachés facultatifs pour retracer les origines de la vidéo.
En revanche, SynthID de Google applique une stratégie plus large, intégrant des filigranes dans le texte, les images, l’audio et la vidéo. Les deux technologies font preuve de résilience face aux modifications courantes telles que le recadrage, la compression et le filtrage.
Applications et défis
Bien que Video Seal vise principalement à lutter contre la désinformation, son les applications s’étendent bien au-delà. Des industries telles que les médias et le divertissement pourraient utiliser cette technologie pour prévenir le piratage et vérifier l’authenticité du contenu. Par exemple, les studios hollywoodiens pourraient intégrer des filigranes dans les fichiers de films pour suivre les copies non autorisées.
Cependant, il existe des limites. Les vidéos fortement compressées ou celles soumises à des modifications importantes peuvent dégrader le signal du filigrane. L’équipe de recherche reconnaît que, bien que Video Seal démontre une grande robustesse face aux transformations courantes, y compris la compression et les modifications géométriques, son filigrane peut se dégrader ou devenir irrécupérable dans des conditions extrêmes, comme une compression importante ou des modifications substantielles.
Un autre défi réside dans adoption. Bien que Meta ait rendu Video Seal open source, son adoption généralisée par l’industrie dépend de la compatibilité avec les flux de travail existants et de la volonté de s’éloigner des systèmes propriétaires.
L’introduction de Video Seal reflète l’engagement déclaré de Meta en faveur du développement responsable de l’IA. Plus tôt cette année, la société a signalé que moins de 1 % des informations erronées liées aux élections détectées sur ses plateformes étaient générées par l’IA, soulignant son approche proactive en matière de modération du contenu. Cela s’inscrit dans la stratégie plus large de Meta visant à atténuer les abus de l’IA tout en favorisant l’innovation.
En lançant Video Seal en tant qu’outil open source, Meta a franchi une étape importante vers la résolution des défis posés par l’IA générative. Sa capacité à intégrer des filigranes imperceptibles mais résilients dans les vidéos combat non seulement les abus, mais renforce également la confiance dans le contenu numérique. Alors que les industries sont aux prises avec les implications de l’IA, des outils tels que Video Seal pourraient devenir essentiels pour maintenir la transparence et l’authenticité.