Microsoft y OpenAI, que enfrentan acusaciones de infracción de derechos de autor por parte de The New York Times y otros editores, argumentaron ante un tribunal federal el martes que su uso de artículos de noticias disponibles públicamente para entrenar modelos de lenguaje de gran tamaño (LLM) es legal según el uso legítimo. doctrina.

La demanda , presentado en diciembre de 2023 y ahora consolidado con afirmaciones similares de The New York Daily News y el Center for Investigative Reporting, sostiene que los sistemas de inteligencia artificial como ChatGPT y Microsoft Copilot han aprovechado material protegido por derechos de autor sin autorización. socavando los ingresos de los editores y los derechos de propiedad intelectual.

Los demandantes afirman que estos modelos de IA, entrenados en conjuntos de datos que contienen millones de artículos, pueden reproducir o resumir su contenido de manera que sustituya las obras originales.”Se trata de reemplazar el contenido, no de transformarlo”, afirmó Ian Crosby, en representación del New York Times.

Crosby advirtió que tales prácticas podrían desviar entre el 30% y el 50% del tráfico de noticias en línea fuera de los sitios web de los editores.

La doctrina del uso justo en el centro del caso

La defensa de OpenAI depende del argumento de que su uso de datos de noticias es transformador y, por lo tanto, está protegido por la doctrina del uso justo de Joseph. Gratz, abogado de OpenAI, explicó al juez Sidney Stein que ChatGPT procesa datos dividiéndolos en unidades más pequeñas llamadas tokens, lo que permite que el modelo reconozca patrones y genere contenido nuevo en lugar de replicar texto directamente.

Joseph. Gratz, un abogado de OpenAI, dijo que regurgitar artículos completos”no es para lo que está diseñado y no es lo que hace”cuando se trata de cómo opera ChatGPT, argumentando que los resultados que se asemejan a material protegido por derechos de autor a menudo ocurren solo después de que indicaciones específicas de usuarios intentan deliberadamente obtener tales respuestas.

El equipo legal de Microsoft apoyó estas afirmaciones, estableciendo paralelismos entre el entrenamiento en IA y las innovaciones tecnológicas anteriores, como las videograbadoras y las fotocopiadoras, que inicialmente fueron cuestionadas pero finalmente consideradas legales.

Argumentaron que el uso legítimo permite el desarrollo de tecnologías que benefician a la sociedad sin comprometer los derechos de los creadores de contenido.”La ley de derechos de autor no es más un obstáculo para el LLM que lo que lo fue para la videograbadora (o la pianola, la fotocopiadora, la computadora personal, Internet o el motor de búsqueda)”, afirmó la compañía en sus documentos judiciales.

Los editores reclaman daños financieros y éticos

Los editores argumentan que el uso sin licencia de su contenido no sólo viola la ley de derechos de autor sino que también amenaza su sostenibilidad financiera. La demanda destaca ejemplos específicos en los que. herramientas de inteligencia artificial resumir artículos o proporcionar recomendaciones de productos que evitan los muros de pago de los editores

Según el Times, Bing Chat de Microsoft, ahora rebautizado como Copilot, ha redirigido a lectores potenciales lejos de su plataforma afiliada Wirecutter, reduciendo el tráfico y los ingresos.

Steven Lieberman, en representación de The New York Daily News, criticó la estrategia de las empresas de tecnología. dependencia de fuentes como Common Crawl, una organización sin fines de lucro que agrega datos web para uso público. Describió la práctica como un “beneficio gratuito” del trabajo de periodistas y editores, que permite a las empresas de IA monetizar contenido que no crearon ni licenciaron.

Si bien OpenAI sostiene que este enfoque democratiza el acceso a los datos, los críticos señalan

Para agravar el problema está el uso de generación aumentada de recuperación (RAG) por parte de OpenAI, un método que integra información en tiempo real del sistema. web en respuestas generadas por IA Aunque esta técnica mejora la relevancia y precisión de los resultados, plantea preguntas sobre cómo se accede y se reproduce el contenido de los editores.

Altos riesgos: posible destrucción de conjuntos de datos y sanciones financieras.

La demanda busca miles de millones de dólares en daños y pide la destrucción de conjuntos de datos que contengan materiales no autorizados. Tal fallo podría tener profundas implicaciones para OpenAI y Microsoft, obligándolos a reconstruir su IA. sistemas que utilizan únicamente contenido con licencia o de dominio público.

La ley federal de derechos de autor permite multas de hasta 150 000 dólares por cada caso de infracción intencionada, una cifra que podría aumentar dramáticamente dado el volumen de datos involucrados.

Herramienta de Media Manager retrasada y respuestas de la industria

La demanda también subraya las frustraciones por el retraso en el lanzamiento de OpenAI de su herramienta Media Manager, inicialmente prometida en mayo de 2024 para brindar a los creadores un mayor control sobre cómo se utiliza su contenido en los conjuntos de datos de entrenamiento de IA.

Los críticos argumentan que este fracaso deja a los editores más pequeños y a los creadores independientes con opciones limitadas para proteger su propiedad intelectual.

Si bien las principales editoriales como TIME, The New Yorker, Vogue, Vanity Fair, Bon Appetit y Wired y más de 200 publicaciones más han conseguido acuerdos de licencia con OpenAI, muchos actores más pequeños carecen de los recursos para negociar acuerdos similares..

La industria en general sigue dividida: algunas empresas se asocian para obtener licencias de contenido para el desarrollo de IA, mientras que otras inician litigios. En Canadá, una coalición de editores ha presentado demandas acusando a OpenAI de”scraping generalizado”y autores destacados como Michael Chabon han expresado preocupaciones similares.

El juez se pronunciará sobre la moción de desestimación

El juez Sidney Stein, quien demostró un gran conocimiento de las cuestiones técnicas durante la audiencia, aún no se ha pronunciado sobre la moción de desestimación de los acusados.

Stein reconoció la complejidad del caso. caso, afirmando que el uso legítimo probablemente jugaría un papel fundamental en su decisión. El resultado podría sentar un precedente crítico sobre cómo los sistemas de IA generativa interactúan con materiales protegidos por derechos de autor y las obligaciones de los desarrolladores hacia los creadores de contenido.

Como el Aunque los procedimientos legales continúan, las implicaciones se extienden mucho más allá de OpenAI y Microsoft. Este caso tiene el potencial de dar forma al futuro de la IA generativa, equilibrando la innovación con los derechos de los editores y creadores.

Categories: IT Info