Google ha lanzado Veo 3.1, una importante actualización de su modelo de generación de vídeos mediante IA que mejora el control creativo y el realismo de los creadores. La nueva versión se está implementando en la herramienta cinematográfica de inteligencia artificial de Google, Flow, e introduce capacidades de edición más granulares.
Los usuarios ahora pueden agregar objetos a una escena y beneficiarse de un audio más rico y sincronizado en todas las funciones avanzadas de Flow. La actualización, que también mejora el cumplimiento rápido y la calidad visual, está disponible en el editor Flow, la aplicación Gemini y a través de la API Gemini para desarrolladores.
Este movimiento indica la intención de Google de hacer que sus herramientas generativas sean más potentes e intuitivas. Desde el lanzamiento de Flow en mayo, los usuarios han creado más de 275 millones de videos, lo que indica una fuerte demanda de creación de videos accesibles con IA. El lanzamiento se considera un movimiento competitivo directo contra Sora 2 de OpenAI.
Llega a Flow un control creativo más granular
En su anuncio, Google formuló la actualización como una respuesta directa a los comentarios de los creadores sobre herramientas de posgeneración más sofisticadas.
Según los líderes de producto Jess Gallegos y Thomas Iljic, “siempre estamos escuchando sus comentarios y hemos oído que quieres más control artístico dentro de Flow, con mayor soporte para audio en todas las funciones”.
Este enfoque en la iteración impulsada por el usuario marca un cambio estratégico, moviendo a Flow de un motor de generación pura a una suite creativa más completa e interactiva.
La pieza central de este esfuerzo es un conjunto de nuevas herramientas de edición dentro del editor Flow diseñadas para momentos en los que la primera toma no es la final.
[contenido incrustado]
La incorporación más notable es la función”Insertar”, que permite a los creadores agregar nuevos elementos, desde detalles sutiles y realistas hasta criaturas completamente fantásticas, en un videoclip ya generado.
Está diseñado para brindar a los usuarios el poder de reimaginar y perfeccionar sus escenas directamente dentro de la aplicación, lo que reduce la necesidad de software de edición externo para ajustes y adiciones menores.
Según Google, el modelo la sofisticación garantiza que estas adiciones parezcan naturales y contextualmente apropiadas. Veo 3.1 analiza inteligentemente la escena existente para manejar detalles complejos como sombras e iluminación ambiental, asegurando que el nuevo objeto esté basado en el entorno.
Además, el modelo funciona para combinar el elemento insertado con el estilo artístico establecido del clip. Esta capacidad va más allá de la simple colocación de objetos, ofreciendo una forma más dinámica y cohesiva de refinar el contenido generado por IA.
Para complementar esta nueva capacidad, Google también anunció que una función correspondiente”Eliminar”estará”próximamente”en el editor Flow.
Permitirá a los usuarios eliminar sin problemas objetos o personajes no deseados de una escena. La compañía explicó que Flow reconstruirá automáticamente el fondo y los alrededores, haciendo que parezca como si el objeto nunca hubiera estado allí.
En conjunto, estas características representan un paso significativo hacia proporcionar un conjunto completo de herramientas de pintura y pintura para video con IA.
Desde clips silenciosos hasta narraciones con audio enriquecido
Un enfoque importante de la versión Veo 3.1 es la expansión del audio. capacidades. Partiendo de la base de Veo 3, que fue el primer modelo de Google en integrar sonido, la actualización ahora trae la generación de audio a las funciones creativas más avanzadas de Flow.
Esta mejora aborda una limitación clave de las herramientas de video de IA anteriores. Como declaró anteriormente el director ejecutivo de Google DeepMind, Demis Hassabis,”estamos saliendo de la era silenciosa de la generación de videos”. Esta actualización es un paso importante para cumplir esa visión, agregando diálogos, efectos de sonido y ruido ambiental.
Su enfoque en el realismo es fundamental para producir contenido creíble y atractivo sin un trabajo de posproducción extenso.
Los creadores ahora pueden generar audio rico y sincronizado cuando usan funciones como”Ingredientes para video”, que utiliza imágenes de referencia para controlar los personajes y el estilo. La herramienta”Fotogramas a vídeo”, para crear transiciones entre dos imágenes, ahora también incluye audio.
[contenido incrustado]
La función”Extender”, utilizada para crear tomas continuas más largas, ahora también generará paisajes sonoros de acompañamiento, lo que la hará más útil para establecer tomas y secuencias narrativas más largas.
Un lanzamiento estratégico en la carrera del vídeo con IA
Google está implementando Veo 3.1 en todo su conjunto de productos de IA para maximizar su alcance. Más allá del editor Flow orientado al consumidor y la aplicación Gemini, el modelo ahora está disponible para desarrolladores y clientes empresariales.
Los desarrolladores pueden acceder a Veo 3.1 y sus nuevas funciones a través de una vista previa paga en la API de Gemini, lo que les permite integrar las potentes funciones. capacidades de generación de vídeo en sus propias aplicaciones. Los clientes empresariales pueden aprovechar el modelo a través de Vertex AI.
Esta estrategia de distribución multifacética muestra la ambición de Google de competir en el campo de la IA en rápida evolución. video. El lanzamiento se produce poco después del controvertido lanzamiento de la aplicación Sora 2 de OpenAI, que enfrentó una reacción inmediata por preocupaciones sobre derechos de autor y falsificaciones profundas.
Por el contrario, Google continúa enfatizando su compromiso con la IA responsable, incorporando su marca de agua SynthID en todo el contenido generado. Esta estrategia parece calculada para posicionar a Veo como una alternativa más estable y preparada para la empresa.
La actualización también refuerza la estrategia clarificada de suscripción de dos niveles de Google, agregando valor tangible a sus planes AI Pro y AI Ultra para fomentar la adopción y construir una base de usuarios leales.
Dando forma al futuro del cine con IA
La rápida evolución de Se espera que las herramientas de vídeo generativo transformen las industrias creativas. La introducción de controles de edición detallados y audio integrado en Veo 3.1 reduce la barrera técnica para la producción de video de alta calidad, lo que permite a los narradores repetir ideas más rápidamente.
A medida que estas plataformas maduran, se vuelven menos novedosas y más una parte integral del flujo de trabajo creativo, desde el guión gráfico hasta la producción final. El enfoque está cambiando de una simple salida de texto a video a un proceso más interactivo y colaborativo entre el creador humano y el modelo de IA.