O Google expandiu seu gerador de vídeo com AI VEO 2 para usuários avançados de Gemini, permitindo a criação de vídeo baseada em texto diretamente das interfaces web e móvel da plataforma. Os assinantes do Plano Premium de AI de US $ 19,99/mês agora podem usar o VEO 2 para gerar clipes de vídeo de 8 segundos e 720p com base em avisos escritos. O movimento marca uma mudança da experimentação no nível da empresa para a criatividade voltada para o consumidor, facilitando a se envolver com as ferramentas de produção de vídeo de vídeo de IA. Essa ferramenta, acessível através do Google Labs, abre fluxos de trabalho de imagem para vídeo para entusiastas e designers visuais. Antes disso, os desenvolvedores e equipes corporativos usavam o VEO 2 através da AI do Vertex, onde o custo é de US $ 0,50 por segundo do conteúdo renderizado. O lançamento para a Gemini Advanced segue sua nuvem no próximo anúncio de 2025 em 9 de abril e acesso ao desenvolvedor em 11 de abril, completando uma estratégia de lançamento de várias camadas. Realismo

Ao contrário das ferramentas mais simples e prontas para o vídeo, o VEO 2 permite que os usuários influenciem as características cinematográficas. Instruções como “rastrear o assunto com uma profundidade de campo rasas” ou “use uma lente grande angular” são entendidas e refletidas na saída final. O Google afirma que o modelo foi treinado na”linguagem da cinematografia”, permitindo o controle de estilo específico de tiro geralmente visto nas plataformas de vídeo da IA ​​do consumidor. Esses exemplos, apresentados nas demonstrações iniciais, demonstraram a capacidade do VEO 2 de replicar comportamento de iluminação, movimento natural e fidelidade de textura-áreas que desafiam a maioria dos sistemas de vídeo generativos. Embora os Gemini avançados restrinjam a geração a uma saída curta e de baixa resolução, o mecanismo fundamental permanece o mesmo. Isso confere à VEO uma vantagem competitiva na qualidade visual, embora as restrições de camadas de acesso ainda limitem o desempenho completo para usuários que não são de entendores. Os criadores de shorts podem usar linguagem natural para aplicar estilos visuais a clipes gerados pela IA. 

Essas ferramentas dependem da mesma infraestrutura VEO 2, mas com diferentes camadas de interface do usuário e modelos de acesso. A Gemini Advanced oferece acesso agrupado, enquanto o YouTube e os laboratórios refletem a estratégia do Google de incorporar IA generativa nos ecossistemas criativos existentes. Os usuários de Gêmeos pagam uma assinatura mensal plana e recebem um número de gerações limitadas, com os usuários do Google Noting serão”notificados à medida que abordam seu limite mensal de geração” de acordo com seu blog oficial . Por outro lado, o uso em vértice ai pode custar centenas de dólares por minuto, dependendo da resolução e comprimento do clipe. O AI Studio, com preço entre US $ 0,35/segundo, serviu como ponte durante o acesso ao início de abril para desenvolvedores.

Ainda assim, os usuários de Gemini não recebem o mesmo conjunto de controle. Recursos como lapso de tempo, seqüenciamento multi-shot e ferramentas de edição de fundo são exclusivas de vertex ai. fluxos de trabalho em vídeo. Essas restrições sinalizam um lançamento escalonado intencional-equilibrando o acesso e o desempenho para impedir a sobrecarga de servidores e a degradação da qualidade. Essa assinatura invisível permite a verificação do conteúdo sem afetar a qualidade. O sistema alinha aos padrões C2PA e sustenta as reivindicações de implantação responsável da IA ​​do Google. No entanto, o sintídeo sozinho não pode aplicar políticas de uso, a menos que as plataformas de terceiros suportem detecção e aplicação-algo ainda inconsistente entre os serviços.

A posição do Google nos dados de treinamento permanece vaga. Embora os criadores do YouTube possam optar por não participar do treinamento de modelos de terceiros, a empresa mantém direitos para usar o conteúdo público para sua própria IA. A política do YouTube afirma que”acessar o conteúdo do criador de maneiras não autorizadas, como raspagem não autorizada, permanece proibida”, mas os críticos observam que isso não aborda completamente as preocupações com as contribuições involuntárias do modelo. Até então, a especulação continua sobre o papel dos dados do YouTube na criação de recursos da VEO. Por exemplo, o modelo foi usado para ajudar a aprimorar o assistente de Oz para a cúpula LED imersiva em

Essa visão permanece em desenvolvimento. Por enquanto, a chegada do Veo 2 a Gemini avançou sinais uma ambição mais imediata: dar a não especialistas uma ferramenta que possa animar idéias sem precisar de câmeras, equipes ou software de edição caro. Ainda está limitado-por resolução, duração e níveis de acesso-mas também é o exemplo mais claro do que a intenção do Google de trazer vídeo generativo para os fluxos de trabalho criativos diários.