Um tribunal alemão decidiu que o ChatGPT da OpenAI não pode reproduzir letras de músicas protegidas por direitos autorais, uma decisão histórica que desafia a forma como os modelos generativos de IA são treinados.

Em um veredicto proferido hoje em Munique, o Tribunal Regional de Munique I apoiou a organização alemã de direitos musicais GEMA, declarando a OpenAI responsável por violação de direitos autorais. Sua determinação concluiu que os modelos da OpenAI “memorizam” ilegalmente e produzem trabalhos protegidos, rejeitando a defesa da empresa de que seu processo é coberto por exceções legais para mineração de texto e dados.

Estabelecendo um precedente europeu significativo, a decisão descreve novas responsabilidades para os desenvolvedores de IA em relação à propriedade intelectual. Em resposta, a OpenAI anunciou que apelará da decisão.

Uma decisão histórica: o tribunal considera a ‘memorização’ da IA uma violação de direitos autorais

Em uma decisão com implicações para a indústria de IA generativa, o tribunal de Munique concluiu que a OpenAI é diretamente responsável por violações de direitos autorais quando seu chatbot exibe letras protegidas.

Trazido pela GEMA em nome de vários artistas alemães, o caso centrou-se em nove músicas específicas, incluindo obras de Helene Fischer e Rolf Zuckowski.

GEMA, abreviação de Gesellschaft für musikalische Aufführungs-und mechanische Vervielfältigungsrechte (Sociedade para Performance Musical e Reprodução Mecânica Rights), é uma sociedade de gestão coletiva alemã que gerencia direitos musicais em nome de compositores, letristas e editores musicais.

A GEMA argumentou que a capacidade do ChatGPT de gerar reproduções quase perfeitas dessas letras provou que elas foram usadas ilegalmente em seus dados de treinamento.

No centro da disputa legal estava a interpretação do tribunal de “memorização”.

De acordo com o comunicado de imprensa oficial, o tribunal concluiu que as letras estavam contidas de forma reproduzível dentro dos parâmetros do modelo, o que constitui uma forma de duplicação sob a lei de direitos autorais. Essa conclusão contraria diretamente as afirmações de alguns desenvolvedores de IA de que seus modelos aprendem conceitos em vez de armazenar cópias textuais.

Crucialmente, o tribunal desmantelou a defesa primária da OpenAI: que suas atividades eram permitidas sob a exceção de mineração de texto e dados (TDM) da Alemanha. Argumentando que este escudo legal serve para analisar informações, o tribunal concluiu que não se aplica quando uma IA reproduz obras inteiras de uma forma que prejudica a capacidade de lucro do criador original.

“A premissa da Mineração de Texto e Dados… de que nenhum interesse comercial é afetado… não se aplica nesta constelação”, afirmou o tribunal. “Pelo contrário, as reproduções fornecidas no modelo interferem no direito de exploração do detentor dos direitos.”

O tribunal elaborou que a exceção TDM se baseia na ideia de que a análise subsequente não interfere na exploração normal da obra original.

Ao memorizar e reproduzir as letras, o tribunal concluiu que a OpenAI estava criando um produto substituto que compete diretamente com os serviços de letras licenciados, prejudicando assim o mercado primário dos detentores dos direitos.

Esta interpretação detalhada restringe significativamente a aplicabilidade das defesas TDM para IA generativa na Alemanha.

Os juízes também responsabilizaram a OpenAI, e não o usuário final, pela violação. Como os resultados poderiam ser gerados com instruções simples, o tribunal concluiu que a arquitetura do sistema da OpenAI foi o fator decisivo na violação.

Um cenário jurídico divergente: como a decisão alemã se compara globalmente

Enquanto a OpenAI prepara o seu recurso, a decisão acrescenta-se a uma colcha de retalhos crescente de decisões jurídicas internacionais que não oferecem um consenso claro sobre IA e direitos de autor. Diferentes jurisdições estão chegando a conclusões totalmente diferentes, criando um ambiente complexo e incerto para desenvolvedores que operam globalmente.

Nos Estados Unidos, um caso semelhante envolvendo o laboratório de IA Anthropic e editoras musicais foi resolvido por meio de um acordo.

Em vez de um veredicto judicial, a Anthropic concordou em manter e aplicar “proteções” técnicas para evitar que sua Claude AI reproduzisse letras protegidas por direitos autorais.

A doutrina de “uso justo” do sistema jurídico dos EUA, que permite o uso não licenciado de material protegido por direitos autorais para fins “transformativos”, foi uma parte central da defesa em muitos desses casos, embora sua aplicação ao treinamento em IA continue sendo uma questão ferozmente debatida e não resolvida.

Também é importante distinguir o caso da música de uma ação coletiva separada, onde Anthropic estabeleceu um fundo de liquidação de US$ 1,5 bilhão para os autores que alegaram que seus livros foram usados para treinamento sem permissão.

Enquanto isso, uma decisão recente do Supremo Tribunal do Reino Unido em um caso entre a Getty Images e a Stability AI ofereceu uma interpretação mais amigável ao desenvolvedor.

Constatando que os resultados gerados pela IA não são baseados em trabalhos armazenados ou copiados, o tribunal de Londres sugeriu que o treinamento em material protegido por direitos autorais não constitui inerentemente uma violação da lei britânica. O foco de Munique na “memorização” como forma de reprodução contrasta diretamente com esta conclusão.

Tal divergência realça os altos riscos destas batalhas jurídicas. Como observou a especialista jurídica Silke von Lewinski, do Instituto Max Planck antes do veredicto, o resultado de tais casos é crítico para todos os criadores.

“Isso tem importância fundamental para todas as obras, sejam elas literatura, textos jornalísticos, música, artes visuais, fotografia ou quaisquer outras obras que sejam usado para IA generativa”, disse ela.

Implicações mais amplas: um precedente para todas as indústrias criativas

Embora específica para letras de músicas, a decisão de Munique envia um sinal poderoso a todos os setores criativos. Autores, jornalistas, fotógrafos e desenvolvedores de software estão acompanhando de perto esses procedimentos, já que os princípios legais se aplicam igualmente ao seu trabalho.

Se o treinamento não licenciado constitui uso justo ou violação continua sendo o campo de batalha central.

Essa incerteza jurídica se estende a outros meios de comunicação, principalmente ao jornalismo. Grandes editoras, incluindo o The New York Times, entraram com processos de direitos autorais semelhantes contra a OpenAI e a Microsoft, argumentando que as ferramentas generativas de IA usam ilegalmente seus vastos arquivos de artigos para criar produtos concorrentes.

Uma perda para os desenvolvedores de IA nesses casos poderia forçar uma reengenharia fundamental de seus modelos de negócios, criando potencialmente um novo mercado de licenciamento em grande escala para dados de treinamento de alta qualidade.

Algumas empresas de IA estão tentando superar os desafios legais atacando o licenciamento proativo. ofertas.

Garantir uma fonte estável e legal de dados de treinamento e, ao mesmo tempo, compensar os criadores é o objetivo principal desta estratégia. A própria OpenAI fez parceria com organizações de mídia como a TIME e a Associated Press, criando uma estrutura para usar seu conteúdo no treinamento de modelos.

Sugerindo um possível caminho a seguir, esses acordos podem ajudar a evitar litígios contenciosos.

No entanto, com incontáveis terabytes de dados existentes extraídos da web, o litígio continua a ser o principal impulsionador da política.

A Alemanha estará acompanhando de perto o resultado do recurso da OpenAI, assim como vários outros processos judiciais pendentes.

Por enquanto, a vitória da GEMA em Munique proporciona um impulso significativo para os detentores de direitos, que argumentam que as empresas de IA devem ser responsabilizadas pelos dados que utilizam.

Isso reforça a ideia de que o avanço tecnológico não pode ocorrer às custas dos direitos de propriedade intelectual estabelecidos, preparando o terreno para novos confrontos legais e regulatórios.

Categories: IT Info