O Google aumentou oficialmente sua campanha nas guerras generativas da IA, lançando seu modelo de texto para imagem, Imagen 4, juntamente com uma contraparte mais poderosa, Imagen 4 Ultra. Em 24 de junho, os modelos são acessíveis por meio de uma prévia paga no gemini api e para testes livres limitados em Google Ai Studio , um movimento estratégico projetado para colocar o valor mais avançado da empresa. May e representa um passo significativo nas ambições da empresa. Google diz que o Imagen 4 oferece”renderização significativa de textos significativos”sobre seus precendidos”, que a imagens de imagens, que é uma geração de textos significativos. Esse foco na qualidade e na precisão é central para o campo do Google, pois é jóquei para posição em um mercado cada vez mais lotado e valioso. Esse recurso não é apenas uma nota de rodapé técnica, mas uma resposta direta à crescente demanda por transparência e responsabilidade, à medida que o conteúdo gerado pela IA se torna quase indistinguível da realidade. Em maio, o Google lançou o Synthid Detector, uma ferramenta pública que identifica a mídia criada pela AI, verificando marcas d’água digitais incorporadas em imagens, vídeo, áudio e texto

“Prinding”> pgening) “Prinding”> pgening) “> p. deliberadamente agressivo. O custo do modelo Standard Imagen 4 é diretamente competitivo com o do Dall-E 3 do Openai, sinalizando a intenção do Google de competir não apenas pela qualidade, mas também na acessibilidade. Para mais desenvolvedores judiciais, o Google está fornecendo Livros detalhados e um limite inicial de API do API 20s de 20 solicitações. O feedback inicial dos testadores sugere que o esforço está valendo a pena, com os usuários relatando letras mais nítidas e menos artefatos visuais em comparação com versões anteriores. Ele entra em um mercado ferozmente competitivo que é projetado para crescer de USD 8.7 Bilion em 2024 para 2024. Nesse ambiente, os principais atores estão buscando estratégias muito diferentes. A Adobe, um titã no espaço de software criativo, lançou recentemente um aplicativo móvel do Firefly que funciona como um hub criativo, integrando modelos de terceiros de rivais como Google e OpenAI ao lado de seus próprios. A Black Forest Labs, uma empresa fundada por ex-líderes de IA de estabilidade, lançou recentemente seu fluxo.1 Kontext Models e os distribui através de uma variedade de parceiros, incluindo Canva e Freepik. Enquanto isso, a competição continua a se expandir além das imagens estáticas. Na semana passada, o Midjourney lançou seu primeiro modelo de geração de vídeo de IA, com o CEO David Holz emoldurando o lançamento como uma etapa fundamental, afirmando em um post no blog: “A IA Model V1 é apenas a próxima pedra em tempo real em tempo aberto em tempo aberto sobre a Lei dos Direitos Abertos,

O caso é apenas uma frente em um conflito global. No Reino Unido, uma batalha legal de referência está em andamento entre as imagens Getty e a AI de estabilidade sobre a suposta raspagem de milhões de fotos protegidas por direitos autorais. Durante os argumentos de abertura, o advogado de Getty chamou o caso de”o dia do acerto de contas para essa abordagem”.

No entanto, os resultados legais estão longe de ser certos. Em uma decisão significativa em 24 de junho, um juiz federal dos EUA constatou que o uso de livros protegidos por direitos autorais para treinar sua IA constituía”uso justo”, mesmo enquanto governava o armazenamento desses livros era uma violação. Essa decisão complexa destaca as nuances legais de que as empresas de IA devem navegar. Ao tentar construir uma plataforma que seja percebida como poderosa e segura, o Google está fazendo uma oferta calculada para conquistar a confiança de clientes corporativos e criadores individuais que estão cada vez mais cautelosos com os riscos legais inerentes à revolução da IA.