Microsoft dan OpenAI, menghadapi dakwaan pelanggaran hak cipta daripada The New York Times dan penerbit lain, telah berhujah di mahkamah persekutuan pada hari Selasa bahawa penggunaan artikel berita yang tersedia secara umum untuk melatih model bahasa besar (LLM) adalah sah di bawah penggunaan adil doktrin.
Tuntutan mahkamah , difailkan pada Disember 2023 dan kini disatukan dengan tuntutan serupa daripada The New York Daily News dan Center for Investigative Reporting, berpendapat bahawa sistem AI seperti ChatGPT dan Microsoft Copilot telah memanfaatkan bahan berhak cipta tanpa kebenaran, menjejaskan hasil penerbit dan hak harta intelek.
Plaintif menegaskan bahawa model AI ini, dilatih pada set data yang mengandungi berjuta-juta artikel, boleh menghasilkan semula atau meringkaskan kandungannya dengan cara yang menggantikan karya asli.”Ini adalah mengenai menggantikan kandungan, bukan mengubahnya,”kata Ian Crosby, mewakili The New York Times.
Crosby memberi amaran bahawa amalan sedemikian boleh mengalihkan antara 30% dan 50% trafik berita dalam talian dari laman web penerbit.
Doktrin Penggunaan Adil di Inti Kes
Pertahanan OpenAI bergantung pada hujah bahawa penggunaan data berita mereka adalah transformatif dan oleh itu dilindungi oleh doktrin penggunaan saksama Joseph Gratz, seorang peguam untuk OpenAI, menjelaskan kepada Hakim Sidney Stein bahawa ChatGPT memproses data dengan memecahkannya kepada unit yang lebih kecil yang dipanggil token, membolehkan model mengenali corak dan menjana kandungan baharu dan bukannya mereplikasi teks secara langsung
Joseph Gratz, seorang peguam OpenAI, berkata memuntahkan keseluruhan artikel”bukan apa yang direka untuk dilakukan dan bukan apa yang dilakukannya”apabila ia melibatkan cara ChatGPT beroperasi. berhujah bahawa output yang menyerupai bahan berhak cipta selalunya berlaku hanya selepas gesaan pengguna tertentu dengan sengaja cuba untuk mendapatkan respons sedemikian.
Pasukan undang-undang Microsoft menyokong dakwaan ini, menarik selari antara latihan AI dan inovasi teknologi terdahulu seperti VCR dan mesin penyalin, yang pada mulanya dipertandingkan tetapi akhirnya dianggap sah.
Mereka berhujah bahawa penggunaan adil membolehkan pembangunan teknologi yang memberi manfaat kepada masyarakat tanpa menjejaskan hak pencipta kandungan. “Undang-undang hak cipta bukan lagi halangan kepada LLM berbanding VCR (atau pemain piano, mesin penyalin, komputer peribadi, internet atau enjin carian),” kata syarikat itu dalam pemfailan mahkamahnya.
Penerbit Menuntut Kemudaratan Kewangan dan Etika
Penerbit berpendapat bahawa penggunaan tanpa lesen kandungan mereka bukan sahaja melanggar undang-undang hak cipta tetapi juga mengancam kewangan mereka Kemampanan itu menyerlahkan contoh khusus di mana alat AI meringkaskan artikel atau memberikan cadangan produk yang memintas dinding berbayar penerbit
Menurut Times, Sembang Bing Microsoft—kini dijenamakan semula sebagai Copilot—telah mengubah hala pembaca yang berpotensi daripadanya. platform gabungan Wirecutter, mengurangkan trafik dan hasil.
Steven Lieberman, mewakili The New York Daily News, mengkritik pergantungan syarikat teknologi pada sumber seperti Common Crawl , sebuah organisasi bukan untung yang mengagregat data web untuk kegunaan awam. Beliau menyifatkan amalan itu sebagai”menunggang bebas”pada kerja wartawan dan penerbit, membolehkan syarikat AI mengewangkan kandungan yang tidak mereka cipta atau melesenkan.
Walaupun OpenAI berhujah bahawa pendekatan ini mendemokrasikan akses kepada data, pengkritik menegaskan bahawa ia termasuk bahan berhak cipta tanpa tapisan yang betul
Menyuburkan isu ini ialah penggunaan penjanaan dipertingkatkan semula (RAG) oleh OpenAI, satu kaedah yang. menyepadukan maklumat masa nyata daripada web ke dalam respons yang dijana oleh AI Walaupun teknik ini meningkatkan perkaitan dan ketepatan output, ia menimbulkan persoalan tentang cara kandungan penerbit diakses dan diterbitkan semula.
Pertaruhan Tinggi.: Potensi Pemusnahan Set Data dan Penalti Kewangan
Tuntutan menuntut ganti rugi berbilion dolar dan meminta pemusnahan set data yang mengandungi bahan yang tidak dibenarkan. Keputusan sedemikian boleh mempunyai implikasi yang mendalam untuk OpenAI dan Microsoft, memaksa mereka membina semula sistem AI mereka hanya menggunakan kandungan domain berlesen atau awam.
Undang-undang hak cipta persekutuan membenarkan denda sehingga $150,000 untuk setiap kejadian pelanggaran yang disengajakan
a>, angka yang boleh meningkat secara mendadak memandangkan jumlah data yang terlibat.
Alat Pengurus Media dan Respons Industri yang Tertangguh
tuntutan mahkamah juga menekankan kekecewaan terhadap pelancaran OpenAI yang tertunda bagi alat Pengurus Medianya, yang pada mulanya dijanjikan pada Mei 2024 untuk memberi pencipta kawalan yang lebih besar ke atas cara kandungan mereka digunakan dalam set data latihan AI.
Pengkritik berpendapat bahawa kegagalan ini menyebabkan penerbit yang lebih kecil dan pencipta bebas mempunyai pilihan terhad untuk melindungi harta intelek mereka.
Walaupun penerbit utama seperti TIME, The New Yorker, Vogue, Vanity Fair, Bon Appetit dan Wired serta lebih daripada 2oo penerbitan lain telah memperoleh perjanjian pelesenan dengan OpenAI, ramai pemain yang lebih kecil kekurangan sumber untuk merundingkan tawaran serupa.
Industri yang lebih luas kekal berpecah, dengan sesetengah syarikat menerima perkongsian untuk melesenkan kandungan untuk pembangunan AI, manakala yang lain meneruskan litigasi. Di Kanada, gabungan penerbit telah memfailkan saman menuduh OpenAI sebagai”pengikisan yang meluas”, dan pengarang terkemuka seperti Michael Chabon telah menyuarakan kebimbangan yang sama.
Hakim untuk Memutuskan Usul Pemecatan
Hakim Sidney Stein, yang menunjukkan pemahaman yang kukuh tentang isu teknikal semasa perbicaraan, masih belum memutuskan usul defendan untuk menolak.
Stein mengakui kerumitan kes itu, menyatakan bahawa penggunaan adil berkemungkinan memainkan peranan penting dalam keputusannya Hasilnya boleh menetapkan duluan penting untuk bagaimana sistem AI generatif berinteraksi dengan bahan berhak cipta dan kewajipan pembangun. terhadap pencipta kandungan.
Sementara prosiding undang-undang diteruskan, implikasinya melangkaui OpenAI dan Microsoft Kes ini berpotensi untuk membentuk masa depan AI generatif. mengimbangi inovasi dengan hak penerbit dan pencipta.