O Google lançou o Veo 3.1, uma atualização significativa em seu modelo de geração de vídeo com IA que aprimora o controle criativo e o realismo dos criadores. A nova versão está sendo lançada na ferramenta de produção de filmes com IA do Google, Flow, introduzindo recursos de edição mais granulares.

Os usuários agora podem adicionar objetos a uma cena e se beneficiar de um áudio mais rico e sincronizado em todos os recursos avançados do Flow. A atualização, que também melhora a adesão imediata e a qualidade visual, está sendo disponibilizada no editor Flow, no aplicativo Gemini e no API Gemini para desenvolvedores.

Essa mudança sinaliza a intenção do Google de tornar suas ferramentas generativas mais poderosas e intuitivas. Desde o lançamento do Flow em maio, os usuários criaram mais de 275 milhões de vídeos, indicando uma forte demanda por criação de vídeos com IA acessível. O lançamento é visto como um movimento competitivo direto contra o Sora 2 da OpenAI.

Controle criativo mais granular chega ao fluxo

Em seu anúncio, o Google enquadrou a atualização como uma resposta direta ao feedback do criador para ferramentas de pós-geração mais sofisticadas.

De acordo com os líderes de produto Jess Gallegos e Thomas Iljic, “estamos sempre ouvindo seus comentários e ouvimos que você queremos mais controle artístico no Flow, com maior suporte para áudio em todos os recursos.”

Esse foco na iteração orientada ao usuário marca uma mudança estratégica, movendo o Flow de um mecanismo de geração puro para um conjunto criativo mais abrangente e interativo.

A peça central desse esforço é um conjunto de novas ferramentas de edição no editor Flow projetadas para momentos em que a primeira tomada não é a final.

[conteúdo incorporado]

A adição mais notável é o recurso”Inserir”, que permite aos criadores adicionar novos elementos (de detalhes sutis e realistas a criaturas totalmente fantásticas) em um videoclipe já gerado.

Ele foi projetado para dar aos usuários o poder de reimaginar e aperfeiçoar suas cenas diretamente no aplicativo, reduzindo a necessidade de software de edição externo para pequenos ajustes e adições.

De acordo com o Google, o a sofisticação do modelo garante que essas adições pareçam naturais e contextualmente apropriadas. O Veo 3.1 analisa de forma inteligente a cena existente para lidar com detalhes complexos como sombras e iluminação ambiente, garantindo que o novo objeto esteja fundamentado no ambiente.

Além disso, o modelo trabalha para combinar o elemento inserido com o estilo artístico estabelecido do clipe. Esse recurso vai além do simples posicionamento de objetos, oferecendo uma maneira mais dinâmica e coesa de refinar o conteúdo gerado por IA.

Complementando esse novo recurso, o Google também anunciou que um recurso correspondente”Remover”estará”chegando em breve”no editor Flow.

Ele permitirá que os usuários retirem facilmente objetos ou personagens indesejados de uma cena. A empresa explicou que o Flow reconstruirá automaticamente o plano de fundo e o ambiente, fazendo com que pareça que o objeto nunca esteve lá.

Juntos, esses recursos representam um passo significativo para fornecer um kit de ferramentas completo de pintura interna e externa para vídeo de IA.

De clipes silenciosos a narrativas de áudio ricas

Um foco principal do lançamento do Veo 3.1 é a expansão do capacidades de áudio. Com base no Veo 3, que foi o primeiro modelo do Google a integrar som, a atualização agora traz a geração de áudio para as funções criativas mais avançadas do Flow.

Essa melhoria aborda uma limitação importante das ferramentas de vídeo de IA anteriores. Como declarou anteriormente o CEO do Google DeepMind, Demis Hassabis, “estamos emergindo da era silenciosa da geração de vídeo”. Esta atualização é um passo significativo no cumprimento dessa visão, adicionando diálogos, efeitos sonoros e ruído ambiente.

Seu foco no realismo é fundamental para a produção de conteúdo crível e envolvente sem um extenso trabalho de pós-produção.

Os criadores agora podem gerar áudio rico e sincronizado ao usar recursos como “Ingredientes para Vídeo”, que usa imagens de referência para controlar personagens e estilo. A ferramenta “Frames to Video”, para criar transições entre duas imagens, agora também inclui áudio.

[conteúdo incorporado]

O recurso “Extend”, usado para criar tomadas mais longas e contínuas, agora também gerará paisagens sonoras de acompanhamento, tornando-o mais útil para estabelecer tomadas e sequências narrativas mais longas.

Um lançamento estratégico na corrida de vídeos de IA

O Google está implantando o Veo 3.1 em todo o seu conjunto de produtos de IA para maximizar seu alcance. Além do editor Flow voltado para o consumidor e do aplicativo Gemini, o modelo agora está disponível para desenvolvedores e clientes corporativos.

Os desenvolvedores podem acessar o Veo 3.1 e seus novos recursos por meio de uma visualização paga na API Gemini, permitindo-lhes integrar o poderoso vídeo capacidades de geração em suas próprias aplicações. Os clientes corporativos podem aproveitar o modelo por meio da Vertex AI.

Essa estratégia de distribuição multifacetada mostra a ambição do Google de competir no campo em rápida evolução de Vídeo de IA. O lançamento ocorre logo após o controverso lançamento do aplicativo Sora 2 da OpenAI, que enfrentou reação imediata devido a preocupações com direitos autorais e deepfake.

Por outro lado, o Google continua a enfatizar seu compromisso com a IA responsável, incorporando sua marca d’água SynthID em todo o conteúdo gerado. Essa estratégia parece calculada para posicionar a Veo como uma alternativa mais estável e pronta para empresas.

A atualização também reforça a estratégia de assinatura de dois níveis esclarecida do Google, agregando valor tangível aos seus planos AI Pro e AI Ultra para incentivar a adoção e construir uma base de usuários fiéis.

Moldando o futuro da produção cinematográfica de IA

A rápida evolução da produção generativa espera-se que as ferramentas de vídeo transformem as indústrias criativas. A introdução de controles de edição refinados e áudio integrado no Veo 3.1 reduz a barreira técnica para a produção de vídeo de alta qualidade, permitindo que os contadores de histórias iterem ideias mais rapidamente.

À medida que essas plataformas amadurecem, elas estão se tornando menos uma novidade e mais uma parte integrante do fluxo de trabalho criativo, desde o storyboard até a produção final. O foco está mudando da simples saída de texto para vídeo para um processo mais interativo e colaborativo entre o criador humano e o modelo de IA.

Categories: IT Info