Hoje, o Google aprimorou seu modelo VEO 3 AI com um novo recurso de imagem para vídeo, permitindo que os usuários transformem uma única foto em um videoclipe de oito segundos com som. Agora, o recurso está lançado para os assinantes dos planos AI Pro e AI Ultra da empresa através do aplicativo Gemini.

Os usuários agora podem fazer upload de uma imagem estática e, com um prompt de texto descritivo, animá-lo em um vídeo curto e dinâmico. Esta atualização ocorre quando o Google relata uma adoção antecipada impressionante para o VEO 3, com usuários criando mais de 40 milhões de vídeos em apenas sete semanas. Segue-se o lançamento global da função Text-Video da VEO 3 na semana passada, solidificando o esforço para tornar as ferramentas generativas avançadas de IA um recurso diário. Para mover a imagem

A tecnologia principal, o VEO 3, representa um salto técnico significativo. Sua capacidade de gerar áudio sincronizado, incluindo diálogo e efeitos ambientais, é um diferencial importante. O CEO do Google Deepmind, Demis Hassabis, declarou que, com esse modelo:”Estamos emergindo da era silenciosa da geração de vídeo”. Eli Collins, um vice-presidente do Google DeepMind, destacou a sofisticação do modelo, observando que”o VEO 3 se destaca do texto e da imagem que solicitam a física do mundo real e a sincronização precisa dos lábios”. Esse foco na física e na sincronização labial é crucial para o conteúdo crível. Dentro do aplicativo Gemini, os usuários selecionam a opção”Vídeos”, enviam uma foto e fornecem instruções de texto para a animação desejada e efeitos de áudio que acompanham. O fluxo integra o veo para vídeo, imagen para ativos de imagem e gêmeos para a linguagem natural que leva, criando um conjunto abrangente para projetos criativos avançados. Esta é uma parte não negociável do processo de geração para todos os usuários.

Todos os vídeos gerados incluem duas camadas de identificação: uma marca d’água visível”Veo”para reconhecimento imediato e uma assinatura digital sintid invisível que foi projetada para ser robusta contra modificações comuns, como a colheita ou a compressão. A empresa pretende fornecer transparência e garantir que o conteúdo gerado pela IA possa ser claramente identificado, uma etapa crucial à medida que essas ferramentas se tornam mais poderosas.

No entanto, a solução não é infalível. Um estudo independente da Universidade de Maryland descobriu que as marcas d’água podem ser vulneráveis ​​à manipulação. Os pesquisadores concluíram: “As marcas d’água oferecem valor nos esforços de transparência, mas não fornecem segurança absoluta contra a manipulação de conteúdo gerada por IA”, Destacando as armas tecnológicas em andamento. Estratégia de assinatura

Esse lançamento do recurso ressalta a renovada estratégia de monetização da AI do Google, que esclareceu em maio, aposentando nomes de marcas confusos como”Gemini Advanced”e”AI Premium”. A revisão foi projetada para acabar com a confusão de longa data e criar uma proposta de valor mais clara. Ele fornece aos usuários 2 TB de armazenamento, o modelo Gemini 2.5 Pro e 1.000 créditos mensais de IA, que o Google diz que fornece”amplo espaço para exploração criativa”. Ele usa 30 TB de armazenamento, uma assinatura premium do YouTube e enormes 12.500 créditos mensais para uso intensivo. Isso é justificado com o acesso antecipado a ferramentas experimentais como o agente do Project Mariner AI.

A estratégia também envolveu um pivô significativo para os usuários do Pro. A mudança para três gerações diárias livres diariamente 3 foi uma mudança de um teste único limitado, transformando o plano em um recurso criativo sustentado, em vez de uma demonstração simples.