Microsoft dan OpenAI, menghadapi tuduhan pelanggaran hak cipta dari The New York Times dan penerbit lainnya, telah berargumen di pengadilan federal pada hari Selasa bahwa penggunaan artikel berita yang tersedia untuk umum untuk melatih model bahasa besar (LLM) adalah sah menurut penggunaan wajar doktrin.
gugatan , diajukan pada bulan Desember 2023 dan sekarang digabungkan dengan klaim serupa dari The New York Daily News dan Center for Investigative Reporting, berpendapat bahwa sistem AI seperti ChatGPT dan Microsoft Copilot telah memanfaatkan materi berhak cipta tanpa izin, merugikan pendapatan penerbit dan hak kekayaan intelektual.
Penggugat menegaskan bahwa model AI ini, yang dilatih pada kumpulan data yang berisi jutaan artikel, dapat mereproduksi atau meringkas konten mereka dengan cara yang menggantikan karya aslinya. “Ini tentang mengganti konten, bukan mengubahnya,” kata Ian Crosby, mewakili The New York Times.
Crosby memperingatkan bahwa praktik seperti itu dapat mengalihkan antara 30% dan 50% lalu lintas berita online dari situs web penerbit.
Doktrin Penggunaan Wajar di Inti Kasus
Pembelaan OpenAI bergantung pada argumen bahwa penggunaan data berita bersifat transformatif dan oleh karena itu dilindungi oleh doktrin penggunaan wajar. seorang pengacara OpenAI, menjelaskan kepada Hakim Sidney Stein bahwa ChatGPT memproses data dengan memecahnya menjadi unit-unit lebih kecil yang disebut token, sehingga model dapat mengenali pola dan menghasilkan konten baru daripada mereplikasi teks secara langsung OpenAI pengacara, mengatakan bahwa memuntahkan seluruh artikel “bukanlah apa yang dirancang untuk dilakukan dan bukan apa yang dilakukannya”dalam hal cara kerja ChatGPT, dengan alasan bahwa keluaran yang menyerupai materi berhak cipta sering kali muncul hanya setelah permintaan pengguna tertentu dengan sengaja berupaya untuk mendapatkan tanggapan seperti itu.
Tim hukum Microsoft mendukung klaim ini, dengan menyamakan antara pelatihan AI dan inovasi teknologi sebelumnya seperti VCR dan mesin fotokopi, yang pada awalnya ditentang namun pada akhirnya dianggap sah.
Mereka berpendapat bahwa penggunaan wajar memungkinkan pengembangan teknologi yang bermanfaat bagi masyarakat tanpa mengorbankan hak-hak pembuat konten. “Undang-undang hak cipta tidak lagi menjadi hambatan bagi LLM dibandingkan terhadap VCR (atau pemutar piano, mesin fotokopi, komputer pribadi, internet, atau mesin pencari),”kata perusahaan tersebut dalam pengajuan pengadilannya.
Penerbit Mengklaim Kerugian Finansial dan Etis
Penerbit berpendapat bahwa penggunaan konten mereka tanpa izin tidak hanya melanggar undang-undang hak cipta tetapi juga mengancam keberlanjutan finansial mereka Alat AI merangkum artikel atau memberikan rekomendasi produk yang melewati penghalang berbayar (paywall) penerbit.
Menurut Times, Bing Chat Microsoft—yang sekarang berganti nama menjadi Copilot—telah mengalihkan calon pembaca dari platform afiliasi Wirecutter, mengurangi lalu lintas dan pendapatan.
Steven Lieberman, mewakili The New York Daily News, mengkritik ketergantungan perusahaan teknologi pada sumber-sumber seperti Common Crawl, sebuah organisasi nirlaba yang mengumpulkan data web untuk penggunaan publik. Ia menggambarkan praktik ini sebagai “penumpang bebas” pada pekerjaan jurnalis dan penerbit, sehingga memungkinkan perusahaan AI memonetisasi konten yang tidak mereka buat atau beri lisensi.
Meskipun OpenAI berargumentasi bahwa pendekatan ini mendemokratisasikan akses terhadap data, para kritikus berpendapat bahwa ternyata konten tersebut berisi materi berhak cipta tanpa pemeriksaan yang tepat.
Yang memperparah masalah ini adalah penggunaan retrieval-augmented generation (RAG) oleh OpenAI, sebuah metode yang mengintegrasikan informasi real-time. dari web menjadi respons yang dihasilkan AI. Meskipun teknik ini meningkatkan relevansi dan keakuratan keluaran, teknik ini menimbulkan pertanyaan tentang bagaimana konten penerbit diakses dan direproduksi.
Taruhan Tinggi: Potensi Penghancuran dan Penghancuran Set Data Sanksi Finansial
Gugatan ini menuntut ganti rugi miliaran dolar dan menyerukan penghancuran kumpulan data yang berisi materi tidak sah. Keputusan seperti itu dapat berdampak besar bagi OpenAI dan Microsoft, sehingga memaksa mereka untuk membangun kembali AI mereka sistem menggunakan hanya konten berlisensi atau domain publik.
Undang-undang hak cipta federal mengizinkan denda hingga $150.000 untuk setiap pelanggaran yang disengaja, angka yang dapat meningkat secara dramatis mengingat besarnya volume data yang terlibat.
Respon Industri dan Alat Manajer Media yang Tertunda
Gugatan tersebut juga menggarisbawahi rasa frustrasi atas penundaan peluncuran alat Manajer Media OpenAI, yang awalnya dijanjikan pada Mei 2024 untuk memberikan kontrol lebih besar kepada pembuat konten atas bagaimana konten mereka digunakan dalam kumpulan data pelatihan AI.
Kritikus berpendapat bahwa kegagalan ini membuat penerbit kecil dan pencipta independen memiliki pilihan terbatas untuk melindungi kekayaan intelektual mereka.
Meskipun penerbit besar seperti TIME, The New Yorker, Vogue, Vanity Fair, Bon Appetit, dan Wired serta lebih dari 200 publikasi lainnya telah mendapatkan perjanjian lisensi dengan OpenAI, banyak pemain kecil tidak memiliki sumber daya untuk menegosiasikan kesepakatan serupa.
Industri yang lebih luas masih terpecah, beberapa perusahaan menjalin kemitraan untuk melisensikan konten untuk pengembangan AI, sementara yang lain menempuh jalur litigasi. Di Kanada, koalisi penerbit telah mengajukan tuntutan hukum yang menuduh OpenAI melakukan “pengikisan yang meluas”, dan penulis terkemuka seperti Michael Chabon telah menyuarakan keprihatinan serupa.
Hakim yang Memerintah tentang Mosi Pemecatan
Hakim Sidney Stein, yang menunjukkan pemahaman yang kuat mengenai masalah teknis selama persidangan, belum mengambil keputusan atas mosi terdakwa untuk memberhentikan.
Stein mengakui rumitnya kasus tersebut dalam kasus ini, dengan menyatakan bahwa penggunaan wajar kemungkinan akan memainkan peran penting dalam keputusannya. Hasil dari keputusan tersebut dapat menjadi preseden penting mengenai bagaimana sistem AI generatif berinteraksi dengan materi berhak cipta dan kewajiban pengembang terhadap pembuat konten.
proses hukum terus berlanjut, dan dampaknya tidak hanya mencakup OpenAI dan Microsoft. Kasus ini berpotensi membentuk masa depan AI generatif, menyeimbangkan inovasi dengan hak penerbit dan pembuat konten.