Dans une décision historique qui sculpte une ligne critique dans le sable pour l’industrie de l’intelligence artificielle, un juge fédéral a statué que la formation de modèles d’IA sur les livres protégés par le droit d’auteur constitue une utilisation équitable”transformatrice”. Cependant, dans le même souffle, le juge a déclaré que la société d’IA Anthropic devait faire face à un procès à enjeux élevés pour l’acte séparé d’utiliser des bibliothèques en ligne piratées pour acquérir ces données, une décision qui pourrait exposer l’entreprise à des milliards de dommages. utilisé pour construire des ensembles de données massifs. Dans un Résumé Ordre de jugement Le 23 juin, le juge ALSUP a décrit la technologie comme un profond innové, le projet, le 23 juin, le juge ALSUP Le problème était parmi les plus transformateurs que beaucoup d’entre nous verront de notre vie.”La décision est la première du genre à s’attaquer à la question de l’utilisation équitable en détail pour une IA générative, offrant un modèle potentiel pour les dizaines d’autres poursuites en matière de droit d’auteur de l’IA se déplaçant actuellement dans les tribunaux.
Ce jugement apporte une clarté à une question qui a assombri l’industrie technologique, où les signaux de judiciaire précédents dans une affaire contre Meta suggéré que le test de base pourrait être un préjudice de marché. Les implications de la décision du juge Alsup sont que, bien que la méthodologie de formation principale d’Anthropic soit légalement saine, ses pratiques passées sur l’approvisionnement de données font désormais l’objet d’un procès sur ce que le juge a appelé un piratage injustifié.

Il s’agit de la première décision majeure pour répondre en détail à la question de l’utilisation équitable, un précédent qui pourrait influencer de nombreux autres cas. La décision fournit un précédent puissant pour d’autres sociétés d’IA comme OpenAI, Meta et Google, qui ont fait des arguments pour une utilisation équitable dans leurs propres batailles juridiques. Il suggère que, aux yeux de la Cour, l’acte de créer un nouvel outil innovant peut être suffisamment transformateur pour être protégé par la loi sur le droit d’auteur, à condition que la sortie finale ne concurrenne pas directement ou ne supporte pas les œuvres originales.
Le péché d’origine: un essai pour la piratie
Pendant que la décision bénisse le processus d’entraînement, c’est Scathing. L’ordonnance du tribunal détaille comment la société a téléchargé plus de sept millions de livres à partir de sites de pirates connus comme Libgen et Books3. Le juge Alsup était sans équivoque que cette loi n’ait pas été protégée, déclarant que la création d’une vaste bibliothèque permanente provenant de sources piratées-ainsi qu’un substitut à payer pour les œuvres-a été une infraction, un arrêt complet.
Le fait que certains de ces livres aient été utilisés plus tard à un but transformateur n’excusent pas de manière rétroactive la piratie initiale.”Nous aurons un procès sur les copies piratées utilisées pour créer la bibliothèque centrale d’Anthropic et les dommages qui en résultent”, a conclu le juge. Les enjeux financiers sont immenses. Alors que les dommages statutaires les plus bas pour la violation du droit d’auteur sont de 750 $ par travail, les demandeurs ont fait valoir que les dommages-intérêts pour violation volontaire pourraient atteindre 150 000 $ par travail.
L’équipe juridique des plaignants a signalé leur intention de poursuivre vigoureusement. Cela ouvre le terrain pour un essai axé non pas sur la nouveauté de l’IA, mais sur la question à l’ancienne du vol.
Une ligne dans le sable: la séparation de l’acquisition de l’application
peut-être l’aspect le plus significatif de la décision est sa séparation minutieuse de différents «utilisations» de la matière héligé par le copyte avec sa propre position légale. Le juge Alsup a fait une distinction claire entre l’acte d’acquérir du contenu et l’acte de l’utiliser pour la formation. Cette approche empêche la «magie» du produit final de désinfecter les méthodes douteuses utilisées pour la créer. Le juge trace essentiellement une ligne dure. Il dit que l’innovation du produit final ne désinfectue pas le vol initial. C’est un message à l’ensemble de l’industrie: nettoyez vos chaînes d’approvisionnement de données.
La logique du juge a été clarifiée par une autre partie de la décision: il a également constaté que la conversion d’Anthropic de livres imprimés légalement achetés dans une bibliothèque numérique privée était une utilisation équitable. Cet acte de «décalage de l’espace»-déteste une copie physique pour créer un numérique plus pratique pour un usage interne-a été jugée transformatrice car elle n’a pas créé de nouvelles copies ou nuire au marché des auteurs.
En gouvernant que la transformation de l’espace et la formation de l’IA étaient une utilisation équitable, mais que la création d’une bibliothèque à partir de sources piratées n’a pas établi un effet cohérent: la légalité de l’action est de son effet et son effet, le juge, le juge a établi un principe cohérent. Droits du titulaire du droit d’auteur, et non sur une approbation générale de toutes les activités liées à l’IA.
Un nouveau front dans la guerre des droits d’auteur plus large de l’IA
Cette décision atterrit au milieu d’une guerre mondiale multi-front entre les créateurs de contenu et les développeurs d’IA. Le conflit a déclenché une vague de litiges, Disney et Universal déposant un procès de violation du droit d’auteur contre le générateur d’images Midjourney et le New York Times poursuivant une affaire de haut niveau contre Openai et Microsoft. La question de base s’étend au-delà du droit d’auteur à la viabilité économique des industries créatives, les éditeurs signalant un effondrement catastrophique dans le trafic de référence à partir des moteurs de recherche, que le PDG de Cloudflare a récemment appelé une”menace existentielle”.
La décision anthropique ne met pas fin aux guerres de copyright de l’IA, mais il résume considérablement le champ de bataille. Il fournit une feuille de route partielle pour les entreprises d’IA, ce qui suggère que l’acte de formation peut être légalement défendable, mais que la chaîne d’approvisionnement des données est désormais une responsabilité juridique et financière massive. L’ère de «gratter d’abord, de poser des questions plus tard» semble être terminée, l’industrie étant désormais confrontée à une pression intense pour prouver la lignée des données et négocier le contenu qui alimente sa technologie transformatrice.