Microsoft și OpenAI, care se confruntă cu acuzații de încălcare a drepturilor de autor din partea The New York Times și alți editori, au susținut marți în instanța federală că utilizarea lor de articole de știri disponibile public pentru a instrui modele lingvistice mari (LLM) este legală în condițiile utilizării loiale. doctrină.
proces , depusă în decembrie 2023 și acum consolidată cu afirmații similare din partea The New York Daily News și Center for Investigative Reporting, susține că sistemele AI precum ChatGPT și Microsoft Copilot au folosit material protejat de drepturi de autor fără autorizație, subminând veniturile editorilor și drepturile de proprietate intelectuală.
Reclamantii susțin că aceste modele AI, instruite pe seturi de date care conțin milioane de articole, pot reproduce sau rezuma conținutul lor în moduri care să înlocuiască originalul fabrică. „Este vorba de înlocuirea conținutului, nu de transformare”, a spus Ian Crosby, reprezentantul The New York Times.
Crosby a avertizat că astfel de practici ar putea devia între 30% și 50% din traficul de știri online departe de site-urile web ale editorilor.
Doctrina utilizării loiale în centrul cazului
Apărarea OpenAI se bazează pe argumentul că utilizarea datelor de știri este transformatoare. și, prin urmare, protejat de doctrina utilizării loiale, Joseph Gratz, un avocat al OpenAI, i-a explicat judecătorului Sidney Stein că ChatGPT procesează datele împărțind-le în unități mai mici numite token-uri. modelul de a recunoaște tipare și de a genera conținut nou, mai degrabă decât de a replica direct textul
Joseph Gratz, un avocat OpenAI, a spus că regurgitarea articolelor întregi „nu este ceea ce este conceput pentru a face și nu ceea ce face”. vine la modul în care funcționează ChatGPT, susținând că rezultatele care seamănă cu materialele protejate prin drepturi de autor apar adesea numai după ce anumite solicitări ale utilizatorilor încearcă în mod deliberat să obțină astfel de răspunsuri.
Echipa juridică a Microsoft le-a susținut. revendicări, făcând paralele între instruirea AI și inovațiile tehnologice anterioare, cum ar fi aparatele video și fotocopiatoare, care au fost inițial contestate, dar în cele din urmă considerate legale.
Ei au susținut că utilizarea loială permite dezvoltarea unor tehnologii care beneficiază societatea fără a compromite drepturile creatorilor de conținut. „Legea drepturilor de autor nu reprezintă un obstacol în calea LLM decât a fost pentru VCR (sau pian, fotocopiator, computer personal, internet sau motor de căutare)”, a declarat compania în dosarele sale în instanță.
Editorii susțin prejudicii financiare și etice
Editorii susțin că utilizarea fără licență a conținutului lor nu numai că încalcă legea drepturilor de autor, ci le amenință și financiar Durabilitatea procesului evidențiază exemple specifice în care instrumentele de inteligență artificială rezumă articole sau oferă recomandări de produse care ocolesc peretele de plată ale editorilor
Potrivit Times, Bing Chat de la Microsoft – acum renumit Copilot – i-a redirecționat pe potențialii cititori. platforma afiliată Wirecutter, reducând traficul și venituri.
Steven Lieberman, reprezentând The New York Daily News, a criticat încrederea companiilor de tehnologie pe surse precum Common Crawl , o organizație nonprofit care cumulează date web pentru uz public. El a descris practica ca fiind o „reducere liberă” a muncii jurnaliştilor şi editorilor, permiţând companiilor AI să monetizeze conţinutul pe care nu l-au creat sau pe care nu l-au licenţiat.
În timp ce OpenAI susţine că această abordare democratizează accesul la date, criticii subliniază dezvăluie că include materiale protejate prin drepturi de autor fără o verificare adecvată
Problema agravată este utilizarea de către OpenAI a generației de recuperare augmentată (RAG), o metodă care integrează. informații în timp real de pe web în răspunsuri generate de inteligență artificială Deși această tehnică sporește relevanța și acuratețea rezultatelor, ridică întrebări cu privire la modul în care este accesat și reprodus conținutul editorilor.
Mize mari: Potențiala distrugere a setului de date și sancțiuni financiare
Procesul solicită despăgubiri de miliarde de dolari și solicită distrugerea seturilor de date care conțin Materiale neautorizate O astfel de hotărâre ar putea avea implicații profunde pentru OpenAI și Microsoft, obligându-le să-și reconstruiască sistemele AI folosind numai conținut licențiat sau de domeniu public.
Legea federală privind drepturile de autor permite amenzi de până la 150.000 USD pentru fiecare caz de încălcare intenționată, o cifră care ar putea escalada dramatic, având în vedere volumul de date implicat.
Instrumentul Media Manager întârziat și răspunsurile industriei
Procesul subliniază, de asemenea, frustrările legate de lansarea întârziată de către OpenAI a instrumentului său Media Manager, promis inițial în mai 2024 pentru a oferi creatorilor un control mai mare asupra modului în care conținutul lor este utilizat în seturile de date de instruire AI.
Criticii susțin că acest eșec lasă editorilor mai mici și creatorilor independenți opțiuni limitate pentru a-și proteja proprietatea intelectuală.
În timp ce editori majori precum TIME, The New Yorker, Vogue, Vanity Fair, Bon Appetit și Wired și peste 200 de alte publicații au obținut acorduri de licență cu OpenAI, mulți jucători mai mici nu au resursele necesare pentru a negocia acorduri similare.
Industria mai largă rămâne divizată, unele companii îmbrățișând parteneriate pentru a licenția conținut pentru dezvoltarea AI, în timp ce altele urmăresc litigii. În Canada, o coaliție de editori a intentat procese acuzând OpenAI de „răzbunare pe scară largă”, iar autori proeminenți precum Michael Chabon și-au exprimat îngrijorări similare.
Judecător pentru a se pronunța asupra moțiunii de demitere
Judecătorul Sidney Stein, care a demonstrat o înțelegere puternică a problemelor tehnice în timpul audierii, încă nu se pronunță asupra cererii inculpaților de a respinge
Stein a recunoscut complexitatea cazului, declarând că utilizarea loială va juca probabil un rol esențial în decizia sa de dezvoltatori față de creatorii de conținut.
Pe măsură ce procedurile legale continuă, implicațiile se extind dincolo de OpenAI și Microsoft. Acest caz are potențialul de a modela viitorul AI generativă. echilibrarea inovației cu drepturile editorilor și creatorilor.