Google a publié Veo 3.1, une mise à jour importante de son modèle de génération vidéo IA qui améliore le contrôle créatif et le réalisme pour les créateurs. La nouvelle version est déployée sur l’outil de création de films d’IA de Google, Flow, introduisant des fonctionnalités d’édition plus granulaires.
Les utilisateurs peuvent désormais ajouter des objets à une scène et bénéficier d’un son plus riche et synchronisé dans toutes les fonctionnalités avancées de Flow. La mise à jour, qui améliore également le respect des délais et la qualité visuelle, est disponible dans l’éditeur Flow, dans l’application Gemini et via l’API Gemini pour les développeurs.
Cette décision signale l’intention de Google de rendre ses outils génératifs plus puissants et intuitifs. Depuis le lancement de Flow en mai, les utilisateurs ont créé plus de 275 millions de vidéos, ce qui indique une forte demande pour une création vidéo IA accessible. Cette version est considérée comme une concurrence directe avec Sora 2 d’OpenAI.
Un contrôle créatif plus granulaire arrive dans Flow
Dans son annonce, Google a présenté la mise à jour comme une réponse directe aux commentaires des créateurs concernant des outils de post-génération plus sophistiqués.
Selon les responsables produit Jess Gallegos et Thomas Iljic,”nous sommes toujours à l’écoute de vos commentaires et nous avons entendu dire que vous veulent plus de contrôle artistique dans Flow, avec une prise en charge accrue de l’audio dans toutes les fonctionnalités. L’ajout le plus notable est une fonctionnalité « Insérer », qui permet aux créateurs d’ajouter de nouveaux éléments, depuis des détails subtils et réalistes jusqu’à des créatures entièrement fantastiques, dans un clip vidéo déjà généré.
Il est conçu pour donner aux utilisateurs le pouvoir de réimaginer et de perfectionner leurs scènes directement dans l’application, réduisant ainsi le besoin d’un logiciel de montage externe pour des ajustements et des ajouts mineurs.
Selon Google, le modèle est la sophistication garantit que ces ajouts semblent naturels et adaptés au contexte. Veo 3.1 analyse intelligemment la scène existante pour gérer les détails complexes tels que les ombres et l’éclairage ambiant, garantissant ainsi que le nouvel objet est ancré dans l’environnement.
De plus, le modèle s’efforce de mélanger l’élément inséré dans le style artistique établi du clip. Cette fonctionnalité va au-delà du simple placement d’objets, offrant une manière plus dynamique et cohérente d’affiner le contenu généré par l’IA.
En complément de cette nouvelle fonctionnalité, Google a également annoncé qu’une fonctionnalité correspondante « Supprimer » « sera bientôt disponible » dans l’éditeur Flow.
Elle permettra aux utilisateurs de supprimer de manière transparente les objets ou les personnages indésirables d’une scène. La société a expliqué que Flow reconstruira automatiquement l’arrière-plan et l’environnement, donnant l’impression que l’objet n’a jamais été là.
Ensemble, ces fonctionnalités représentent une étape importante vers la fourniture d’une boîte à outils complète d’in-painting et d’out-painting pour la vidéo IA.
Des clips silencieux à une narration audio riche
L’un des principaux objectifs de la version Veo 3.1 est l’expansion de l’audio. capacités. S’appuyant sur les fondations de Veo 3, qui a été le premier modèle de Google à intégrer le son, la mise à jour apporte désormais la génération audio aux fonctions créatives les plus avancées de Flow.
Cette amélioration corrige une limitation clé des outils vidéo d’IA antérieurs. Comme l’a déclaré Demis Hassabis, PDG de Google DeepMind, « nous sortons de l’ère silencieuse de la génération vidéo ». Cette mise à jour constitue une étape importante dans la réalisation de cette vision, en ajoutant des dialogues, des effets sonores et du bruit ambiant.
L’accent mis sur le réalisme est essentiel pour produire un contenu crédible et attrayant sans travail de post-production approfondi.
Les créateurs peuvent désormais générer un son riche et synchronisé lorsqu’ils utilisent des fonctionnalités telles que « Ingrédients pour la vidéo », qui utilisent des images de référence pour contrôler les personnages et le style. L’outil « Frames to Video », permettant de créer des transitions entre deux images, inclut désormais également l’audio.
[contenu intégré]
La fonctionnalité « Étendre », utilisée pour créer des plans plus longs et continus, générera désormais également des paysages sonores d’accompagnement, ce qui la rendra plus utile pour établir des plans et des séquences narratives plus longues.
Un déploiement stratégique dans la course à la vidéo IA
Google déploie Veo 3.1 sur l’ensemble de sa suite de produits d’IA afin d’optimiser sa portée. Au-delà de l’éditeur Flow destiné aux consommateurs et de l’application Gemini, le modèle est désormais disponible pour les développeurs et les entreprises clientes.
Les développeurs peuvent accéder à Veo 3.1 et à ses nouvelles fonctionnalités via un aperçu payant dans l’API Gemini, leur permettant d’intégrer les puissantes capacités de génération vidéo dans leurs propres applications. Les entreprises clientes peuvent exploiter ce modèle via Vertex AI.
Cette stratégie de distribution à plusieurs volets montre l’ambition de Google d’être compétitif dans le domaine en évolution rapide de l’IA. vidéo. Cette sortie intervient peu de temps après le lancement controversé de l’application Sora 2 d’OpenAI, qui a fait face à des réactions négatives immédiates en raison de problèmes de droits d’auteur et de deepfake.
En revanche, Google continue de souligner son engagement en faveur d’une IA responsable, en intégrant son filigrane SynthID dans tout le contenu généré. Cette stratégie semble calculée pour positionner Veo comme une alternative plus stable et plus adaptée aux entreprises.
La mise à jour renforce également la stratégie d’abonnement à deux niveaux de Google, ajoutant une valeur tangible à ses plans AI Pro et AI Ultra pour encourager l’adoption et construire une base d’utilisateurs fidèles.
Façonner l’avenir de la réalisation de films IA
L’évolution rapide des technologies génératives les outils vidéo devraient transformer les industries créatives. L’introduction de commandes d’édition plus fines et d’audio intégré dans Veo 3.1 abaisse les barrières techniques pour une production vidéo de haute qualité, permettant aux conteurs d’itérer plus rapidement sur les idées.
À mesure que ces plates-formes mûrissent, elles deviennent moins une nouveauté et font davantage partie intégrante du flux de travail créatif, du storyboard à la production finale. L’accent est désormais mis sur la simple sortie texte-vidéo vers un processus plus interactif et collaboratif entre le créateur humain et le modèle d’IA.