Uma nova investigação impressionante do Atlântico descobriu uma vasta captura de dados não autorizada no centro do boom da AI.

O relatório mostra que gigantes da tecnologia como Meta, Microsoft e Nvidia têm .

Este conteúdo, raspado de mais de 2 milhões de canais, está sendo usado para treinar poderosos modelos de vídeo generativos de IA. A prática alimenta a corrida do setor de tecnologia para dominar a próxima onda de IA. Ele também coloca essas empresas contra milhões de criadores, que agora enfrentam uma ameaça existencial. As revelações despertaram uma reação imediata dos criadores e defensores dos direitos, aumentando um debate já tenso sobre dados, direitos autorais e consentimento na era da IA. A investigação identificou pelo menos 13 conjuntos de dados diferentes usados ​​por quem é quem da Big Tech, incluindo Amazon, Bytedance, Snap e Tencent. Isso confirma relatórios anteriores de raspagem por empresas como Apple e Anthropic. Para os criadores, a notícia é uma traição profunda. A questão não é apenas sobre direitos autorais, mas sobre a justiça fundamental de um ecossistema onde o trabalho dos criadores é colhido para construir seus concorrentes diretos. Em dezembro de 2024, a plataforma introduziu uma nova configuração, permitindo que os criadores optem pelo treinamento de IA de terceiros. Fundamentalmente, esse controle está desligado por padrão, colocando o ônus do consentimento nas empresas de IA.

Isso seguiu as atualizações anteriores destinadas à transparência e proteção. Em setembro de 2024, o YouTube começou a aprimorar seu sistema de identificação de conteúdo para detectar rostos e vozes gerados pela IA. Um mês depois, introduziu um rótulo”capturado com uma câmera”para verificar imagens autênticas. Battlefield

A abordagem”Raspe First First, pergunte mais tarde”agora está enfrentando um acerto de contas legais. Os processos estão aumentando, com criadores como David Millette processando a NVIDIA e o Openai por enriquecimento sem causa e concorrência desleal sobre o uso de seus vídeos. Esse conflito se transformou em batalhas corporativas de alto risco. O conselheiro geral da Disney, Horacio Gutierrez, não picou palavras, afirmando:”A pirataria é a pirataria. E o fato de ser feito por uma empresa de IA não a torna menos infrator.”A empresa de IA antrópica concordou recentemente com um recorde de liquidação de US $ 1,5 bilhão com os autores de livros sobre o uso de trabalhos protegidos por direitos autorais-um acordo aclamado como o”momento do Napster”da indústria de IA. Mas em uma virada impressionante, a aprovação do assentamento foi prejudicada.

EUA. O juiz distrital William Alsup criticou a proposta como”em nenhum lugar perto de concluir”, colocando em risco todo o acordo. Seu ceticismo decorre de uma decisão anterior, onde ele separou o ato de treinamento da IA ​​da aquisição de dados. Esse escrutínio judicial lançou o caso e a estratégia legal do setor, no caos. À medida que os tribunais começam a traçar uma linha nítida entre a tecnologia transformadora e a pirataria de dados definitivos, o terreno legal abaixo do boom generativo da IA ​​está começando a parecer cada vez mais instável. As empresas estão despejando bilhões no desenvolvimento de ferramentas generativas para texto, imagens e vídeos, e dados de treinamento de alta qualidade são o combustível essencial. O objetivo é capturar um mercado projetado para valer mais de US $ 2,5 bilhões em 2032.

O Google lançou agressivamente seu modelo VEO 3, que pode gerar vídeo com áudio sincronizado, para suas camadas de assinatura. O CEO do Google DeepMind, Demis Hassabis, declarou:”Estamos emergindo da era silenciosa da geração de vídeo”, sinalizando as altas riscos. Enquanto isso, a Microsoft respondeu ao oferecer o poderoso modelo SORA do OpenAI gratuitamente. Esse frenesi competitivo ressalta por que o conteúdo do criador é tão valioso. Ele fornece a vasta, diversificada e de alta qualidade, necessária para construir a próxima geração de IA, independentemente de sua origem.