Investigasi baru yang menakjubkan dari Atlantik telah mengungkap perampasan data yang luas dan tidak sah di inti booming AI.

Laporan tersebut menunjukkan bahwa raksasa teknologi seperti meta, Microsoft, dan nvidia memiliki .

Konten ini, dikikis dari lebih dari 2 juta saluran, digunakan untuk melatih model video AI generatif yang kuat. Praktik ini memicu perlombaan industri teknologi untuk mendominasi gelombang AI berikutnya. It also pits these firms against millions of creators, who now face an existential threat.

Their own work is being used to build tools that could make them obsolete. Pengungkapan telah memicu reaksi langsung dari pencipta dan advokat hak, meningkatkan perdebatan yang sudah tegang tentang data, hak cipta, dan persetujuan di zaman AI.

masalah skala dan persetujuan

Skala pengumpulan data mengejutkan. Investigasi mengidentifikasi setidaknya 13 dataset berbeda yang digunakan oleh siapa yang berteknologi besar, termasuk Amazon, Bytedance, Snap, dan Tencent. Ini mengkonfirmasi laporan sebelumnya tentang pengikisan oleh perusahaan-perusahaan seperti Apple dan Anthropic.

Unduhan massal ini melanggar ketentuan layanan YouTube, namun sebagian besar terus tidak terkendali. Bagi pencipta, berita itu adalah pengkhianatan yang mendalam.

[Konten tertanam]

pekerja kayu Jon Peters, yang salurannya termasuk di antara mereka yang dikikis, menangkap perasaan tidak berdaya, bertanya,”Saya pikir semuanya akan dicuri… apakah saya berhenti, atau saya hanya membuat video dan berharap orang-orangnya ingin terhubung dengan seseorang.”Masalahnya bukan hanya tentang hak cipta tetapi tentang keadilan mendasar suatu ekosistem di mana tenaga kerja pencipta dipanen untuk membangun pesaing langsung mereka.

Tightrope Walk YouTube

Tertangkap di tengah, YouTube telah meluncurkan serangkaian ukuran reaktif. Pada bulan Desember 2024, platform memperkenalkan pengaturan baru yang memungkinkan pencipta untuk ikut serta dalam pelatihan AI pihak ketiga. Yang terpenting, kontrol ini dimatikan secara default, menempatkan beban persetujuan pada perusahaan AI.

Ini mengikuti pembaruan sebelumnya yang ditujukan untuk transparansi dan perlindungan. Pada bulan September 2024, YouTube mulai meningkatkan sistem ID kontennya untuk mendeteksi wajah dan suara yang dihasilkan AI. A month later, it introduced a “captured with a camera”label to verify authentic footage.

However, these tools don’t address a core issue: Google itself continues to use YouTube content to train its own models, like Veo 3. This policy highlights a difficult conflict of interest for the platform as it tries to serve both its creators and its parent company’s AI ambitions.

The Legal Battlefield

Pendekatan”Scrape First, Ask Lantor”industri sekarang menghadapi perhitungan hukum. Tuntutan hukum meningkat, dengan pencipta seperti David Millette menggugat Nvidia dan Openai untuk pengayaan yang tidak adil dan persaingan yang tidak adil atas penggunaan video mereka.

Setelan individu ini adalah bagian dari perang hukum yang lebih besar terhadap industri yang dibangun di atas dasar konsep data massa, data yang tidak dikreditkan. Konflik ini telah meningkat menjadi pertempuran perusahaan berisiko tinggi.

Dalam kasus tengara, Disney dan Universal mengajukan gugatan luas terhadap AI Lab Midjourney, menuduhnya membangun modelnya pada kekayaan intelektual curian. Penasihat Umum Disney, Horacio Gutierrez, tanpa kata-kata, yang menyatakan,”Pembajakan adalah pembajakan. Dan fakta bahwa itu dilakukan oleh perusahaan A.I tidak membuatnya kurang melanggar.”

Tes paling kritis dari doktrin”penggunaan yang adil”, bagaimanapun, adalah pembukaan di sebuah courtroom San Francisco. Perusahaan AI Anthropic baru-baru ini menyetujui catatan penyelesaian $ 1,5 miliar dengan penulis buku atas penggunaan karya berhak cipta-kesepakatan dipuji sebagai”momen Napster”industri AI. Tetapi dalam giliran yang menakjubkan, persetujuan penyelesaian telah terancam.

U.s. Hakim Distrik William Alsup mengecam proposal itu sebagai”tidak ada yang hampir selesai,”membahayakan seluruh perjanjian. Skeptisisme-nya berasal dari keputusan sebelumnya di mana ia memisahkan tindakan pelatihan AI dari akuisisi data.

Sementara ia menyebut model AI-nya”pada dasarnya transformatif,”ia mengutuk penggunaan buku bajakan antropik dari”perpustakaan bayangan”sebagai”dosa asli”yang merupakan pencurian. Pengawasan yudisial ini telah melemparkan kasus ini, dan strategi hukum industri, menjadi kekacauan.

Dengan penyelesaian yang ditahan, antropik sekali lagi menghadapi uji coba potensial yang dapat mengakibatkan kerusakan bencana. Ketika pengadilan mulai menarik garis yang tajam antara teknologi transformatif dan pembajakan data langsung, tanah hukum di bawah boom AI generatif mulai terlihat semakin tidak stabil.

perlombaan senjata yang dipicu oleh konten pencipta

Perebutan data panik digerakkan oleh ras”AI Arms AI-ARM.”Perusahaan menuangkan miliaran untuk mengembangkan alat generatif untuk teks, gambar, dan video, dan data pelatihan berkualitas tinggi adalah bahan bakar penting. Tujuannya adalah untuk menangkap pasar yang diproyeksikan bernilai lebih dari $ 2,5 miliar pada tahun 2032.

Google telah secara agresif meluncurkan model VEO 3-nya, yang dapat menghasilkan video dengan audio yang disinkronkan, ke tingkatan berlangganannya. CEO Google Deepmind Demis Hassabis menyatakan,”Kami muncul dari era sunyi generasi video,”menandakan taruhan tinggi. Sementara itu, Microsoft membalas dengan menawarkan model Sora Openai yang kuat secara gratis.

Bahkan meta, setelah kemunduran internal, berputar ke teknologi midjourney yang melisensikan untuk mengimbangi. Kegilaan yang kompetitif ini menggarisbawahi mengapa konten pencipta sangat berharga. Ini memberikan bahan baku yang luas, beragam, dan berkualitas tinggi yang diperlukan untuk membangun generasi AI berikutnya, terlepas dari asalnya.

Categories: IT Info