Microsoft i OpenAI, w obliczu zarzutów naruszenia praw autorskich ze strony „The New York Times” i innych wydawców, argumentowały we wtorek przed sądem federalnym, że wykorzystywanie przez nie publicznie dostępnych artykułów prasowych do uczenia dużych modeli językowych (LLM) jest zgodne z prawem w ramach dozwolonego użytku doktryna.

pozew , złożone w grudniu 2023 r. i obecnie połączone z podobnymi twierdzeniami dziennika „The New York Daily News” i „Centrum for Investigative Reporting”, utrzymuje, że systemy sztucznej inteligencji, takie jak ChatGPT i Microsoft Copilot, wykorzystały materiałów chronionych prawem autorskim bez zezwolenia, co podważa przychody wydawców i prawa własności intelektualnej.

Powodowie twierdzą, że te modele sztucznej inteligencji, wyszkolone na zbiorach danych zawierających miliony artykułów, mogą odtwarzać lub podsumowywać swoją treść w sposób zastępujący oryginał fabryka. „Chodzi o wymianę treści, a nie jej przekształcanie” – powiedział Ian Crosby reprezentujący The New York Times.

Crosby ostrzegł, że takie praktyki mogą odwrócić od 30% do 50% ruchu z wiadomościami online od wydawców stron internetowych.

Doktryna dozwolonego użytku w sercu sprawy

Obrona OpenAI opiera się na argumencie, że wykorzystywanie przez nią danych informacyjnych ma charakter transformacyjny i dlatego jest chronione przez doktryna dozwolonego użytku Joseph Gratz, prawnik OpenAI, wyjaśnił sędziemu Sidneyowi Steinowi, że ChatGPT przetwarza dane, dzieląc je na mniejsze jednostki zwane tokenami, umożliwiając modelowi rozpoznawanie wzorców i generowanie nowej treści zamiast bezpośredniego replikowania tekstu.

Joseph Gratz, prawnik OpenAI, powiedział, że powtarzanie całych artykułów „nie jest tym, do czego został zaprojektowany, a nie tym, do czego ma służyć”, jeśli chodzi o sposób działania ChatGPT, argumentując, że wyniki przypominające materiały chronione prawem autorskim często pojawiają się tylko po konkretnych podpowiedziach użytkowników celowo próbowano uzyskać takie odpowiedzi.

Zespół prawny firmy Microsoft poparł te twierdzenia, dokonując porównań między szkoleniami w zakresie sztucznej inteligencji a wcześniejszymi innowacjami technologicznymi, takimi jak magnetowidy i kserokopiarki, które były początkowo kwestionowana, ale ostatecznie uznana za zgodną z prawem.

Argumentowali, że dozwolony użytek pozwala na rozwój technologii, które przynoszą korzyści społeczeństwu, bez uszczerbku dla praw twórców treści. „Prawo autorskie nie stanowi większej przeszkody dla LLM niż było dla magnetowidu (lub pianina, kserokopiarki, komputera osobistego, Internetu czy wyszukiwarki)” – stwierdziła firma w swoich pismach sądowych.

Wydawcy zgłaszają szkody finansowe i etyczne

Wydawcy twierdzą, że nielicencjonowane wykorzystanie ich treści nie tylko narusza prawo autorskie, ale także zagraża ich stabilności finansowej. W pozwie przytoczono konkretne przykłady gdzie narzędzia AI podsumowują artykuły lub wyświetlają rekomendacje produktów, które omijają zapory wydawców.

Według „The Times” usługa Bing Chat firmy Microsoft — obecnie przemianowana na Copilot — przekierowała potencjalnych czytelników z dala od platforma stowarzyszona Wirecutter, redukująca ruch i przychody.

Steven Lieberman, reprezentujący dziennik The New York Daily News skrytykował poleganie firm technologicznych na źródłach takich jak Common Crawl, organizacja non-profit, która agreguje dane internetowe do użytku publicznego. Opisał tę praktykę jako „swobodną jazdę” na pracy dziennikarzy i wydawców, umożliwiającą firmom zajmującym się sztuczną inteligencją zarabianie na treściach, których nie stworzyły ani nie licencjonowały.

Chociaż OpenAI twierdzi, że takie podejście demokratyzuje dostęp do danych, krytycy zwracają uwagę okazuje się, że zawiera materiały chronione prawami autorskimi bez odpowiedniego sprawdzenia.

Problem pogłębia wykorzystanie przez OpenAI technologii generowania wspomaganego pobieraniem (RAG), metody integrującej informacje pochodzące z czasu rzeczywistego. sieci w odpowiedzi generowane przez sztuczną inteligencję Chociaż technika ta zwiększa trafność i dokładność wyników, rodzi pytania dotyczące sposobu uzyskiwania dostępu do treści wydawców i ich reprodukcji.

Wysokie stawki: potencjalne zniszczenie zbioru danych i finanse. Kary

W pozwie żąda się miliardów dolarów odszkodowania i wzywa do zniszczenia zbiorów danych zawierających nieautoryzowane materiały. Takie orzeczenie mogłoby mieć poważne konsekwencje dla OpenAI i Microsoft, zmuszając je do tego odbudować swoje systemy sztucznej inteligencji, korzystając wyłącznie z treści licencjonowanych lub należących do domeny publicznej.

Federalne prawo autorskie przewiduje kary w wysokości do 150 000 dolarów za każdy przypadek umyślnego naruszenia, a liczba ta może dramatycznie wzrosnąć, biorąc pod uwagę ilość danych.

Narzędzie Menedżera opóźnionych multimediów i reakcje branży

The pozew podkreśla również frustrację związaną z opóźnionym wdrożeniem przez OpenAI narzędzia Media Manager, które pierwotnie obiecano w maju 2024 r., aby zapewnić twórcom większą kontrolę nad sposobem wykorzystywania ich treści w zbiorach danych szkoleniowych AI.

Krytycy twierdzą, że ta porażka pozostawia mniejszym wydawcom i niezależnym twórcom ograniczone możliwości ochrony swojej własności intelektualnej.

Podczas gdy główni wydawcy, tacy jak TIME, The New Yorker, Vogue, Vanity Fair, Bon Appetit i Wired oraz ponad 200 innych publikacji, zabezpieczyli umowy licencyjne z OpenAI, wielu mniejszym graczom brakuje zasobów, aby negocjować podobne umowy.

Szersza branża pozostaje podzielona – niektóre firmy nawiązują współpracę partnerską w celu licencjonowania treści na potrzeby rozwoju sztucznej inteligencji, inne zaś wszczynają postępowania sądowe. W Kanadzie koalicja wydawców złożyła pozwy, oskarżając OpenAI o „powszechne wycofywanie się”, a wybitni autorzy, tacy jak Michael Chabon, wyrazili podobne obawy.

Sędzia wyda orzeczenie w sprawie wniosku o zwolnienie

Sędzia Sidney Stein, który podczas rozprawy wykazał się dużym zrozumieniem kwestii technicznych, nie wydał jeszcze orzeczenia w sprawie wniosku pozwanych o oddalenie skargi

Stein przyznał się do złożoności sprawy, stwierdzając, że dozwolony użytek prawdopodobnie odegra kluczową rolę w jego decyzji. Wynik może stanowić krytyczny precedens dla interakcji generatywnych systemów sztucznej inteligencji z materiałami chronionymi prawem autorskim oraz obowiązków programistów wobec twórców treści.

W miarę kontynuowania postępowania sądowego konsekwencje wykraczają daleko poza OpenAI i Microsoft. Ta sprawa może potencjalnie ukształtować przyszłość generatywnej sztucznej inteligencji, równoważąc innowacje z prawami wydawców i twórców.

Categories: IT Info