Reddit a engagé une action en justice contre la startup d’intelligence artificielle Anthropic le 4 juin, alléguant que la société d’IA a utilisé illégalement son vaste contenu généré par l’utilisateur pour former des modèles d’IA comme Claude. Le procès, déposé à la Cour supérieure de la Californie dans le comté de San Francisco plainte légale , Accuse Anthropic of Breach of Contrat, UnJust Enrich, et Undercus, parmi les accuses anthropiques de Breach of Contrat, UnJust Enrich. Autres affirmations. Reddit affirme que Anthropic a systématiquement gratté les données sans accord de licence, profitant directement du contenu de la plate-forme tout en bafouant ses conditions d’utilisation.

Cette action juridique met en évidence l’escalade de tension entre les plateformes de contenu et les développeurs d’IA sur l’utilisation des données en ligne. Reddit fait valoir qu’Anthropic, qui se présente en tant que chef d’IA éthique, a poursuivi sa récolte de données même après avoir affirmé avoir arrêté.

Le procès est particulièrement remarquable car Reddit a établi des accords de licence de données payants avec d’autres grandes entités AI, y compris un partenariat avec OpenAI et Google, établissant un précédent Anthropia, prétendument ignoré. The outcome could significantly influence how AI companies access public online data and how platforms monetize content while protecting user privacy.

Allegations of Deception and Continued Data Mauvaise utilisation

La plainte légale déposée par Reddit détaille un modèle d’accès présumé non autorisé aux données par anthropique datant au moins décembre 2021. Le dossier de Reddit affirme que”anthropic est en fait formé intentionnellement sur les données personnelles des utilisateurs de Reddit sans jamais demander leur consentement”. La plainte soutient en outre que les directives Robots.TXT Anthropic ont non tenu compte du Reddit, qui sont conçues pour guider les robots Web.

Un point clé du procès est l’accusation de fausse déclaration. Reddit affirme qu’en juillet 2024, à la suite de déclarations publiques de Reddit sur les données abusives, Anthropic a déclaré publiquement qu’il avait empêché ses robots d’accéder à Reddit.

Cependant, la plainte allègue que cela a été faux:”Les robots d’Anthropic ont continué à frapper les serveurs de Reddit sur une centaine de fois.”Cela contredit directement une déclaration qu’un porte-parole anthropique a faite à la verge en juillet 2024 . Selon le PDG de Reddit, Steve Huffman, Reddit figurait sur sa liste de blocs de robots Web depuis la mi-mai 2024.

Le dossier juridique de Reddit appelle cette déclaration précédente «fausse», citant les journaux d’audit comme preuve d’un accès continu. Le procès fait référence sur un document de recherche anthropique en 2021, qui a détaillé l’utilité des données Reddit pour la formation des modèles d’IA, comme preuve de l’intention de longue date d’Anthropic.

Reddit’s Stance sur la monétisation des données Contenu généré par l’utilisateur. Le PDG, Steve Huffman, a souligné à plusieurs reprises la valeur unique des données de Reddit pour la formation de l’IA, le fait de remarquer:”Les modèles d’IA ont besoin de connaissances humaines, et le contenu de Reddit en est plein.”

Cette position a été renforcée par ses commentaires lors d’un événement de l’intelligence artificielle de Wall Street, où il a déclaré:”L’AI doit venir de quelque part. Reddit.”

Pour protéger ses données, Reddit a mis en œuvre une politique de contenu public en mai 2024 Nouvelle politique de contenu public, établissant des règles claires pour l’utilisation des données commerciales. Ceci a été suivi d’une mise à jour de son fichier robots.txt en juillet 2024, qui a restreint l’accès à la plupart des robots Web, à des exceptions notables pour les partenaires payants comme Google.

Reddit soutient que l’ouverture de sa plate-forme n’équivaut pas à l’exploitation commerciale gratuite. La société a également été proactive pour répondre aux préoccupations liées à l’IA sur sa plate-forme, y compris une refonte des processus de vérification des utilisateurs à la suite d’une expérience controversée et non autorisée de l’IA par les chercheurs de l’Université de Zurich.

Implications plus larges pour l’industrie de l’IA Copyright et développement éthique de l’IA. L’affaire met également en lumière anthropique, qui a clôturé en février un cycle de financement de 3,5 milliards de dollars, évaluant la société à environ 61,5 milliards de dollars. Ce contexte financier ajoute du poids aux affirmations de Reddit d’enrichissement injuste.

Reddit lui-même est un participant actif à l’espace d’IA, après avoir lancé son propre outil de recherche alimenté par l’IA, Reddit Answers, développé par des partenariats avec Google Cloud et OpenAI. Cela démontre que le problème de Reddit ne concerne pas la technologie d’IA elle-même, mais avec son utilisation non rémunérée et non autorisée. La bataille juridique entre Reddit et Anthropic est sur le point d’être un cas historique, façonnant potentiellement le paysage futur de la gouvernance des données de l’IA et les responsabilités des entreprises de l’IA.

Categories: IT Info