Kajian akademik baru telah menyampaikan bom untuk industri kecerdasan buatan, mendedahkan bahawa model Llama 3.1 Meta telah menghafal dengan berkesan dan dapat menghasilkan hampir separuh daripada buku Harry Potter yang pertama. Penyelidikan ini memberikan bukti yang paling konkrit setakat ini bahawa regurgitasi verbatim bahan berhak cipta bukanlah”tingkah laku pinggiran,”seperti yang dikatakan oleh beberapa makmal AI, tetapi ciri penting model tertentu yang dilatih pada kandungan popular. Temuan ini secara langsung mencabar tiang teras pertahanan undang-undang industri AI dalam semakin banyak tuntutan hak cipta yang tinggi. Llama 3.1 70B Model dapat mengingati 42% dari Harry Potter dan batu ahli sihir. Ini mewakili peningkatan dramatik dari 4.4% yang dihafal oleh pendahulunya, Llama 1, yang menunjukkan bahawa kaedah latihan meta yang lebih baru-baru ini dengan ketara menguatkan kecenderungan model untuk mengekalkan dan menghasilkan semula teks hak cipta. Bekerja. Para penyelidik mendapati bahawa model Llama 3.1 yang sama menghafal hanya 0.13% Sandman Slim, sebuah novel oleh Richard Kadrey, yang menjadi plaintif utama dalam tuntutan tindakan kelas terhadap Meta. Kebolehubahan ini-di mana buku-buku yang sangat popular sangat dihafal sementara kebanyakan orang lain tidak boleh merumitkan usaha untuk mengesahkan tindakan undang-undang tindakan yang luas dan secara serentak memberikan bukti yang kuat untuk pemegang hak cipta individu. salinan haram. Kajian baru menguatkan hujah yang terakhir. Profesor undang-undang Stanford dan pengarang bersama Mark Lemley menyatakan penemuan mencadangkan model itu mengandungi apa yang”undang-undang akan memanggil salinan sebahagian daripada buku dalam model itu sendiri.”Dalam a

Perkembangan ini tanah sebagai meta sudah terperosok dalam pertempuran undang-undang atas sumber datanya. Pemfailan mahkamah dari awal tahun ini mendedahkan bahawa syarikat itu didakwa menggunakan koleksi buku-buku cetak rompak yang luas dari”Perpustakaan Shadow”seperti Libgen untuk melatih model Llama. Kebimbangan seorang jurutera menjadi awam melalui pemfailan:”Torrenting dari komputer riba korporat yang dimiliki [meta] tidak betul.”Hanya menggunakan bahan berhak cipta untuk latihan”penggunaan adil”untuk mengedarkannya secara aktif. Cabaran undang-undang juga global, dengan penerbit dan penulis Perancis memfailkan tuntutan serupa terhadap Meta untuk apa yang mereka sebut sebagai”rompakan monumental.”

Perjuangan ini kini meliputi industri AI, dengan Disney dan Universal baru-baru ini memfailkan tuntutan undang-undang mercu tanda terhadap AI Image Generator Midjourney. Sebagai peguam umum Disney, Horacio Gutierrez, memberitahu The New York Times,”Pembajakan adalah cetak rompak, dan hakikat bahawa ia dilakukan oleh syarikat A.I. tidak membuatnya kurang melanggar. Syarikat itu telah melawan saliran bakat yang teruk-telah kehilangan 11 daripada 14 penulis asal kertas penyelidikan Llama asasnya-dan menghadapi halangan pembangunan yang signifikan. Model yang paling bercita-cita tinggi, parameter 2-trilion llama 4″raksasa,”baru-baru ini ditangguhkan sehingga sekurang-kurangnya lewat 2025 di tengah-tengah perjuangan prestasi.

Krisis dalaman ini telah memacu strategi tinggi untuk membeli kembali ke dalam permainan. Dalam satu langkah dramatik, Meta memuktamadkan pelaburan $ 14 bilion untuk kepentingan 49% dalam skala gergasi pelabelan data AI untuk mendapatkan saluran paip data. Walau bagaimanapun, langkah itu cepat kembali. Sebagai Bloomberg’s Kurt Wagner membincangkan perjanjian itu , beliau menyifatkan”paranoia sebenar”di syarikat itu, memanggil pelaburan”Mark Zuckerberg yang bergerak”untuk menyelam jauh ke kawasan yang dia rasa kurang. Pembiayaan bersama dari saingan Amazon dan Microsoft untuk pembangunan Llama di padang yang digelar”Llama Consortium”. Gabungan kegawatan dalaman ini, tekanan kewangan yang besar, dan jalan pintas undang-undang yang dipersoalkan melukis gambar syarikat yang berjudi reputasinya dan masa depan dalam usaha terdesak untuk mencapai supremasi AI.

Categories: IT Info