Tekanan hukum pada Openai semakin meningkat sebagai Ziff Davis, konglomerat media digital besar yang mengoperasikan portofolio lebih dari 45 situs web global termasuk Mashable, PCMag, IGN, CNET, Lifehacker, dan Eurogamer, telah mengajukan gugatan federal. OpenAI menggunakan konten secara tidak sah dari propertinya, yang menarik rata-rata 292 juta pengunjung bulanan, untuk melatih model AI Powering Services seperti ChatGPT. Ziff Davis mencari kerusakan yang berpotensi berjumlah ratusan juta dolar dan perintah pengadilan untuk menghentikan dugaan pelanggaran.
Tuduhan khusus merinci pelanggaran hak cipta dan teknis
Ziff Davis Klaim Openai”dengan sengaja dan tanpa hambatan”menangani karya-karyanya, menegaskan hal ini terjadi ini. crawlers which parts of a site not to access – to prevent scraping.
The complaint details specific allegations, accusing OpenAI of reproducing Ziff Davis content both verbatim and in Bentuk parafrase, pengupasan penting informasi manajemen copyright (cmiadpy-information-Penulis, dan rincian hak cipta-dan contoh-contoh di mana model Openai diduga secara keliru dikaitkan dengan hasil yang dihasilkan dengan merek Ziff Davis.
Selanjutnya, Ziff Davis menegaskan bahwa ia mengidentifikasi ratusan salinan lengkap dari karya-karyanya di dalam data pelatihan webteks Openai yang tersedia untuk umum. Di luar kerusakan moneter, penerbit meminta pengadilan untuk mencegah OpenAi dari lebih jauh menggunakan kontennya dan berpotensi memaksa penghancuran dataset dan model AI yang dilatih pada materialnya.
Penelitian internal menggagalkan klaim hukum
Tindakan hukum ini dibuktikan oleh penelitian sebelumnya yang dilakukan di dalam Ziff Davis sendiri. Sebuah studi yang diterbitkan pada akhir 2024, yang ditulis bersama oleh pengacara Ziff Davis AI George Wukoson dan CTO Joey Fortuna, memeriksa kumpulan data pelatihan AI yang dikenal publik. The Ziff Davis paper, “The Predominant Use of High-Authority Commercial Web Publisher Content to Train Leading LLMs,”argued that the process of curating datasets for foundational models like OpenAI’s GPT-2 and GPT-3 menghasilkan volume konten yang sangat tinggi dari penerbit komersial premium dibandingkan dengan kehadiran mereka di jaring yang lebih luas.
Analisis mereka menunjukkan peningkatan yang nyata dalam keberadaan konten dari 15 portofolio penerbit utama (termasuk Ziff Davis) sebagai kumpulan data yang dipindahkan dari crawling mentah (seperti crawl umum, di mana saham mereka adalah 0.44%) sebagai kumpulan data yang dipindahkan dari Web Crawls (seperti Common Crawl, di mana saham mereka adalah 0.44%) sebagai kumpulan data yang dipindahkan dari Web Crawls (seperti Common Crawl, di mana mereka adalah 0.44%kumpulan Data. Seperti OpenWebText (9,91%) dan penggantinya OpenWebText2 (12,04%), proksi untuk data pelatihan GPT-3.
Ziff Davis juga menghubungkan ketergantungan ini pada konten yang dikuratori ini dengan skor otoritas domain yang lebih tinggi-sebuah metrik yang menunjukkan konten situs web yang banyak menerbitkan dan menyarankan pengembang yang disarankan secara intensional dari sebuah situs web yang menunjukkan bahwa sebuah valu yang disarankan secara intensif. AI Model.
Pengajuan gugatan dilaporkan mengklaim Ziff Davis berusaha untuk membahas lisensi dengan Openai selama setahun terakhir mengenai dugaan pelanggaran tetapi”ditolak.”
Keluhan juga menuduh Openai mencoba menyembunyikan praktiknya dengan”meninggalkan prinsip pendiriannya.”Openai, merespons melalui juru bicara laporan gugatan, berdiri di dekat pertahanannya yang mapan, menyatakan model-modelnya”didasarkan pada penggunaan yang adil”-sebuah konsep hukum yang memungkinkan penggunaan materi yang dilindungi hak cipta yang terbatas untuk tujuan tertentu, meskipun penampilannya, dan penemuan yang diperdebatkan oleh orang-orang, dan ditingkatkan dengan baik. kehidupan sehari-hari.”Ziff Davis menolak komentar lebih lanjut di luar pengajuan pengadilan, dengan sumber-sumber yang menyarankan bagian dari motivasi adalah harapan penerbit lain mungkin mengikuti jejak mereka.
Penerbit menghadapi AI: Litigasi vs. Penawaran Lisensi
Ziff Davis memasuki arena hukum yang sudah dikelompokkan oleh para pemain media besar. Gugatan New York Times terhadap Openai dan Microsoft, diajukan pada bulan Desember 2023, secara aktif berkembang setelah seorang hakim mengizinkan klaim inti untuk bergerak maju pada akhir Maret.
Surat kabar yang dimiliki oleh Alden Global Capital dan penulis yang diwakili oleh Guild penulis juga mengejar klaim. Awal bulan ini, beberapa kasus hak cipta terhadap Openai
Saat berjuang melawan tuntutan hukum, Openai secara bersamaan mengejar perjanjian lisensi konten. Kesepakatan dengan perusahaan-perusahaan seperti News Corp, Axel Springer, The Associated Press, dan The Washington Post-yang terakhir mengumumkan hanya dua hari sebelum pengarsipan Ziff Davis-memberikan Openai dengan akses ke konten, sering berfokus pada mengintegrasikan berita real-time ke dalam tanggapan chatbot daripada data besar untuk pelatihan. Hubungan pencipta yang lebih rumit adalah kegagalan Openai untuk memberikan alat”Manajer Media”yang dijanjikan pada awal tahun 2025, sebuah sistem yang dimaksudkan untuk memberikan pemilik konten lebih banyak kontrol langsung atas dimasukkannya pekerjaan mereka dalam proses pelatihan AI.