Un tribunal allemand a statué que ChatGPT d’OpenAI ne peut pas reproduire les paroles de chansons protégées par le droit d’auteur, une décision historique qui remet en cause la manière dont les modèles d’IA générative sont formés.
Dans un verdict rendu aujourd’hui à Munich, le tribunal régional de Munich I s’est rangé du côté de l’organisation allemande de défense des droits musicaux GEMA, déclarant OpenAI responsable de violation du droit d’auteur. Sa décision a révélé que les modèles d’OpenAI « mémorisent » et produisent illégalement des œuvres protégées, rejetant la défense de l’entreprise selon laquelle son processus est couvert par des exceptions légales pour l’exploration de textes et de données.
Établir un précédent européen important, la décision définit de nouvelles responsabilités pour les développeurs d’IA en matière de propriété intellectuelle. En réponse, OpenAI a annoncé qu’elle ferait appel de la décision.
Une décision historique : le tribunal considère la « mémorisation » de l’IA comme une violation du droit d’auteur
Dans une décision ayant des implications pour l’industrie de l’IA générative, le tribunal de Munich a estimé qu’OpenAI est directement responsable pour violation du droit d’auteur lorsque son chatbot produit des paroles protégées.
Proposée par la GEMA au nom de plusieurs artistes allemands, l’affaire était centrée sur neuf chansons spécifiques, dont des œuvres d’Helene Fischer et de Rolf Zuckowski.
GEMA, abréviation de Gesellschaft für musikalische Aufführungs-und mechanische Vervielfältigungsrechte (Société pour les droits d’exécution musicale et de reproduction mécanique), est une société de gestion collective allemande qui gère les droits musicaux au nom des compositeurs, des paroliers et des éditeurs de musique.
GEMA a fait valoir que la capacité de ChatGPT à générer des reproductions presque parfaites de ces paroles prouvait qu’elles étaient utilisées illégalement dans ses données de formation.
Au cœur du litige juridique se trouvait l’interprétation du tribunal de la « mémorisation ».
Selon le communiqué de presse officiel, le tribunal a conclu que les paroles étaient contenues de manière reproductible dans les paramètres du modèle, ce qui constitue une forme de duplication au sens de la loi sur le droit d’auteur. Une telle conclusion contredit directement les affirmations de certains développeurs d’IA selon lesquelles leurs modèles apprennent des concepts plutôt que de stocker des copies textuelles.
Le tribunal a démantelé la principale défense d’OpenAI : que ses activités étaient autorisées en vertu de l’exception allemande relative au Text and Data Mining (TDM). Faisant valoir que ce bouclier juridique est destiné à l’analyse d’informations, le tribunal a estimé qu’il ne s’applique pas lorsqu’une IA reproduit des œuvres entières d’une manière qui porte atteinte à la capacité du créateur d’origine à en tirer profit.
“Le principe du Text and Data Mining… selon lequel aucun intérêt commercial n’est affecté… ne s’applique pas dans cette constellation”, a déclaré le tribunal.”Au contraire, les reproductions données dans le modèle interfèrent avec le droit d’exploitation du titulaire des droits.”
Le tribunal a expliqué que l’exception TDM repose sur l’idée qu’une analyse ultérieure n’interfère pas avec l’exploitation normale de l’œuvre originale.
En mémorisant et en reproduisant les paroles, le tribunal a estimé qu’OpenAI créait un produit de substitution qui concurrence directement les services lyriques sous licence, nuisant ainsi au marché primaire des titulaires de droits.
Ceci une interprétation détaillée réduit considérablement l’applicabilité des défenses TDM pour l’IA générative en Allemagne.
Les juges ont également tenu OpenAI, et non l’utilisateur final, pour responsable de l’infraction. Parce que les résultats pouvaient être générés avec des invites simples, le tribunal a estimé que l’architecture du système d’OpenAI était le facteur décisif dans la violation.
Un paysage juridique divergent : comment la décision allemande se compare à l’échelle mondiale
Alors qu’OpenAI prépare son appel, la décision s’ajoute à une mosaïque croissante de décisions juridiques internationales qui n’offrent pas de consensus clair sur l’IA et le droit d’auteur. Différentes juridictions arrivent à des conclusions très différentes, créant un environnement complexe et incertain pour les développeurs opérant à l’échelle mondiale.
Aux États-Unis, une affaire similaire impliquant le laboratoire d’IA Anthropic et des éditeurs de musique a été résolue par un règlement.
Plutôt qu’un verdict de tribunal, Anthropic a accepté de maintenir et d’appliquer des « garde-fous » techniques pour empêcher son Claude AI de reproduire des paroles protégées par le droit d’auteur.
Le « fair use » du système juridique américain. La doctrine, qui autorise l’utilisation sans licence de matériel protégé par le droit d’auteur à des fins « transformatrices », était un élément central de la défense dans bon nombre de ces cas, bien que son application à la formation en IA reste une question âprement débattue et non résolue.
Il est également important de distinguer l’affaire de la musique d’un recours collectif distinct dans lequel Anthropic a établi un fonds de règlement de 1,5 milliard de dollars. pour les auteurs qui affirmaient que leurs livres avaient été utilisés à des fins de formation sans autorisation.
Entre-temps, une décision récente de la Haute Cour du Royaume-Uni dans une affaire entre Getty Images et Stability AI a proposé une interprétation plus conviviale pour les développeurs.
Constatant que les résultats générés par l’IA ne sont pas basés sur des œuvres stockées ou copiées, le tribunal de Londres a suggéré que la formation sur du matériel protégé par le droit d’auteur ne constitue pas en soi une violation de la loi britannique. L’accent mis par Munich sur la « mémorisation » en tant que forme de reproduction contraste directement avec cette constatation.
Une telle divergence met en évidence les enjeux élevés de ces batailles juridiques. Comme l’a souligné l’expert juridique Silke von Lewinski de l’Institut Max Planck avant le verdict, l’issue de tels cas est cruciale pour tous les créateurs.
« Cela revêt une importance fondamentale pour toutes les œuvres, qu’il s’agisse de littérature, de textes journalistiques, de musique, d’arts visuels, de photographie ou de toute autre œuvre qui est utilisé pour l’IA générative”, a-t-elle déclaré.
Implications plus larges : un précédent pour toutes les industries créatives
Bien que spécifique aux paroles de chansons, la décision de Munich envoie un signal puissant à tous les secteurs créatifs. Les auteurs, journalistes, photographes et développeurs de logiciels suivent de près ces procédures, car les principes juridiques s’appliquent également à leur travail.
La question de savoir si une formation sans licence constitue un usage loyal ou une contrefaçon reste le champ de bataille central.
Cette insécurité juridique s’étend à d’autres médias, notamment au journalisme. De grands éditeurs, dont le New York Times, ont intenté des poursuites similaires contre OpenAI et Microsoft, arguant que les outils d’IA générative utilisent illégalement leurs vastes archives d’articles pour créer des produits concurrents.
Une perte pour les développeurs d’IA dans ces cas pourrait forcer une réingénierie fondamentale de leurs modèles commerciaux, créant potentiellement un nouveau marché de licences à grande échelle pour des données de formation de haute qualité.
Certaines sociétés d’IA tentent d’anticiper les défis juridiques en mettant en place des licences proactives. deals.
Garantir une source stable et légale de données de formation tout en rémunérant les créateurs est l’objectif principal de cette stratégie. OpenAI elle-même s’est associée à des organisations médiatiques comme TIME et Associated Press, créant un cadre pour l’utilisation de leur contenu dans la formation de modèles.
Suggérant une voie à suivre potentielle, ces accords pourraient aider à éviter les litiges contentieux.
Cependant, avec d’innombrables téraoctets de données existantes récupérées du Web, les litiges continuent d’être un moteur principal de la politique.
L’Allemagne surveillera de près le résultat de l’appel d’OpenAI, tout comme de nombreux autres. procès en cours.
Pour l’instant, la victoire du GEMA à Munich donne un coup de pouce significatif aux titulaires de droits qui soutiennent que les entreprises d’IA doivent être tenues responsables des données qu’elles utilisent.
Cela renforce l’idée que le progrès technologique ne peut pas se faire au détriment des droits de propriété intellectuelle établis, ouvrant la voie à de nouvelles confrontations juridiques et réglementaires.