Un juge fédéral a statué que le New York Times peut aller de l’avant avec sa poursuite en droit d’auteur contre Openai et Microsoft, permettant aux allégations de base sur la formation du modèle d’IA à procéder au procès.

La décision, livrée le 26 mars 2025, a constaté que les revendications centrales du journal-à cet Openai ont utilisé son journalisme sans autorisation pour former Chatgpt-était le plateau central du papier journal. Certaines réclamations secondaires ont été rejetées.

«Nous apprécions l’opportunité de présenter un jury avec les faits sur la façon dont Openai et Microsoft profitent follement de voler le contenu original des journaux à travers le pays», l’avocat Steven Lieberman, qui représente le New York Times, a déclaré dans une déclaration à npr .

src=”https://winbuzzer.com/wp-content/uploads/2024/06/the-new-york-times-homepage.jpg”>

L’affaire pourrait influencer la façon dont les tribunaux interprètent les protections du droit d’auteur à l’ère de l’utilisation générative, en particulier autour de la gratte et de la résumé des nouvelles pour les qualifications de modélisation comme une utilisation équitable. et la perte de revenus

Le Times a initialement déposé le procès le 27 décembre 2023, à la suite de négociations ratées avec OpenAI. Selon la plainte, OpenAI et Microsoft ont copié des millions d’articles pour former des modèles de gros langues sans demander l’autorisation ni offrir une compensation. La plainte décrit des instances spécifiques où des outils comme Chatgpt et Microsoft Copilot ont généré des sorties ressemblant à des rapports de temps originaux.

Un exemple important impliquait des avis de produits de Wirecutter, le site d’examen d’affiliation du Times. Le procès allègue que les résumés générés par l’AI ont imité les recommandations de Wirecutrage et ont omis des liens d’affiliation, conduisant à une perte dans le trafic et les revenus des lecteurs.

Le journal soutient que ces sorties d’IA fonctionnent comme des remplacements, et non des compléments, pour son journalisme.”Il s’agit de remplacer le contenu, de ne pas le transformer”, a déclaré l’avocat Ian Crosby lors d’une audience de janvier 2025 au cours de laquelle les sociétés ont tenté de rejeter l’affaire.

Microsoft et Openai défendent les pratiques de modèle AI

Openai et Microsoft Artifiés en cour que leurs méthodes d’entraînement sont protégées sous le fait de l’utilisation équitable. Leurs équipes juridiques ont attiré les parallèles historiques avec une technologie plus ancienne comme les photocopiers et les enregistreurs vidéo-Tools autrefois contestés mais finalement jugés légaux en vertu de la loi sur le droit d’auteur.

Microsoft a déclaré dans ses dépôts:”La loi sur le droit d’auteur n’est plus un obstacle à la LLM que pour le VCR (ou le piano des joueurs, l’ordinateur personnel, Internet, ou le moteur de recherche).”L’avocat, Joseph Gratz, a expliqué au juge Sidney Stein que Chatgpt ne reproduit pas des articles entiers. Au lieu de cela, il divise le matériau source en composants plus petits appelés jetons-des unités de texte qui permettent au modèle d’identifier les modèles et de générer de nouvelles réponses.

“La régurgitation entièrement des articles n’est pas ce qu’elle est conçue et non ce qu’elle fait”, a déclaré Gratz. Il a ajouté que les exemples du Times ont été dérivés d’invites atypiques conçues pour provoquer de telles réponses.

Le Times a rejeté cette défense, arguant que la fonctionnalité des modèles d’IA fait toujours un préjudice direct. Crosby a souligné que ces outils peuvent détourner jusqu’à 30 à 50% du trafic d’actualités en ligne des sites Web des éditeurs.

Les frais juridiques, les licenciements et ce qui reste

à la fin de 2024, le Times avait déjà investi 7,6 millions de dollars dans les dépenses légales liées à la cas. Près de 5 millions de dollars ont été dépensés en un seul trimestre. Le procès demande des milliards de dommages et exige la destruction de tout modèle d’IA formé sur son contenu sans licence.

Dans sa décision du 26 mars, le juge Stein a rejeté les réclamations de responsabilité secondaire du Times, mais a autorisé les principales allégations de violation directe du droit d’auteur pour continuer. Sa décision faisait suite à une audience tenue en janvier, au cours de laquelle les deux parties ont débattu de la nature de la formation de l’IA et de l’applicabilité de l’utilisation équitable.

Les experts juridiques pensent que l’affaire pourrait créer un précédent, forçant potentiellement les entreprises d’IA à changer la façon dont elles se rassemblent et utilisent des données de formation. Si les tribunaux se rangent du côté du Times, les développeurs peuvent avoir besoin d’obtenir des licences avant d’ingérer du contenu journalistique.

Beyond Openai: un front juridique plus large

Le procès du Times fait partie d’une vague plus large de litiges des éditeurs et des créateurs préoccupés par l’utilisation non comme une utilisation non agréée de leur travail dans les systèmes AI. En mai 2024, huit journaux appartenant à Alden Global Capital ont déposé une plainte similaire contre Openai et Microsoft. Des auteurs bien connus, dont Sarah Silverman et Michael Chabon, ont également accusé Openai d’utiliser leurs livres sans autorisation pour former le chatppt.

Les autres éditeurs ont opté pour des licences sur les litiges. En 2024, Openai a conclu que le contenu des accords avec l’Atlantique, Vox Media, Time, News Corp et le Financial Times, offrant un paiement en échange d’accès à leurs archives. Ces accords offrent un modèle alternatif pour la formation de l’IA, mais révèlent également la division de l’industrie sur la façon de gérer l’utilisation du contenu dans l’ère de l’IA.

AI de perplexité également dans le réticule

En octobre 2024, le New York Times a également envoyé une lettre de cesseur et un AI de recherche plus petite. La lettre alléguait que la société a résumé le contenu des temps sans autorisation et a ignoré les directives de robots standard.TXT utilisées pour restreindre l’indexation.

Perplexity a nié utiliser des articles de la formation du temps. Au lieu de cela, il affirme que ses modèles «index» les pages Web accessibles au public pour les réponses basées sur la citation. La société a fait face à des plaintes antérieures de Wired, Forbes et Condé Nast sur des problèmes similaires. Son PDG, Aravind Srinivas, a signalé une volonté de travailler avec les éditeurs et a déclaré que «les informations factuelles ne devraient pas être monopolisées». Copyright

Openai a déclaré qu’il avait l’intention d’offrir plus de contrôle des éditeurs sur la façon dont leur contenu est utilisé dans les ensembles de données de formation. En mai 2024, la société a promis un outil de «gestionnaire de médias» qui permettrait aux éditeurs de gérer l’inclusion dans la formation d’IA. Mais pour l’instant, cette fonctionnalité n’avait pas encore été livrée, attirant les critiques des groupes industriels et des petits médias.

Si le temps prévaut devant les tribunaux, Openai et Microsoft pourraient être tenus de reconstruire leurs systèmes d’IA sans aucun contenu gratté du temps-une perspective coûteuse et techniquement difficile. La loi fédérale sur le droit d’auteur permet des amendes pouvant atteindre 150 000 $ par exemple d’infraction volontaire, ce qui signifie que les dommages pourraient évoluer rapidement en fonction du nombre de violations prouvées.

Pour l’instant, l’affaire reste active dans le district sud de New York. La décision de March du juge Sidney Stein ouvre le terrain pour une découverte plus profonde et peut-être un procès avec jury-un qui pourrait aider à définir l’équilibre futur entre le développement de l’IA et la possession de contenu. Les observateurs légaux regardent de près, sachant que les conséquences peuvent s’étendre bien au-delà de la salle d’audience.

Categories: IT Info